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Nel lo 


实验 物理 学 硕士 ， 曾 在 多 家 公司 从 事 
Java 开 发 、 数 据 仓 库 开发 和 软件 测试 
的 工作 ， 主 要 关注 商务 智能 、 大 数据 
和 云 计算 。lvan 喜 欢 写 简洁 的 可 测试 
代码 ， 并 乐于 撰写 有 趣 的 技术 文章 ， 

另 著 有 《NumPy 攻 略 : Python 科 学 计 
CREE De li) 
Python Game Development How-to。 

个 人 博客 : ivanidris.net。 
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内 容 提 要 
本 书 是 NumPy 的 入 门 教程 ， 主 要 介绍 NumPy 以 及 相关 的 Python 科学 计算 库 ， 如 SciPy 和 Matplotlib。 
本 书 内 容 涵盖 NumPy 安装 、 数 组 对 象 、 常 用 函数 、 和 矩阵 运算 、 线 性 代数 、 金 融 函 数 、 窗 函数 、 质 量 控 制 、 
Matplotlib 绘图 、SciPy 简介 以 及 Pygame 等 内 容 ， 涉 及 面 较 广 。 另 外 ，Ivan Idris 针对 每 个 知识 点 给 出 了 简 
短 而 明晰 的 示例 ， 并 为 大 部 分 示例 给 出 了 实用 场景 (如 股票 数据 分 析 )， 在 帮助 初学 者 入 门 的 同时 ， 提 高 
本 书 可 读 性 。 
本 书 适合 正在 找寻 高 质量 开源 计算 库 的 科学 家 、 工 程 师 、 程 序 员 和 定量 管理 分 析 师 阅读 参考 。 
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译 者 序 


NumPy， 即 Numeric Python 的 缩写 ， 是 一 个 优秀 的 开源 科学 计算 库 ， 并 已 经 成 为 Python 科学 
计算 生态 系统 的 重要 组 成 部 分 。NumPy 为 我 们 提供 了 丰富 的 数学 函数 、 强 大 的 多 维 数组 对 象 以 及 
优异 的 运算 性 能 。 尽 管 Python 作 为 流行 的 编程 语言 非常 灵活 易 用 , 但 它 本 身 并 非 为 科学 计算 量 身 
定做 , 在 开发 效率 和 执行 效率 上 均 不 适合 直接 用 于 数据 分 析 , 尤其 是 大 数据 的 分 析 和 处 理 。 幸 运 
的 是 ，NumPy 为 Python 插 上 了 翅膀 ， 在 保留 Python 语言 优势 的 同时 大 大 增强 了 科学 计算 和 数据 处 
理 的 能 力 。 更 重要 的 是 ，NumPy 与 Scipy、Matplotlib 、SciKits 等 其 他 众多 Python 科学 计算 库 很 好 
地 结合 在 一 起 ,共同 构 建 了 一 个 完整 的 科学 计算 生态 系统 。 毫 不 夸张 地 讲 ，NumPy 是 使 用 Python 
进行 数据 分 析 的 一 个 必 备 工具 。 


说 起 NumPy， 我 是 在 数据 的 “赛场 ”上 与 之 结缘 的 。 出 于 对 数据 挖掘 和 机 器 学 习 的 爱好 , 我 
与 中 国 科学 院 和 北京 大 学 的 同学 一 起 组 建 了 一 支 名 为 BrickMover 的 “上 比赛 小 分 队 ”， 队 友 包 括 庞 
亮 、 石 舌 、 刘 旭 东 、 黎 强 、 孙 输 晓 、 刘 璐 等 。 我 们 先后 参加 了 一 些 国内 外 的 数据 迭 掘 比赛 ,包括 
百度 电影 推荐 系统 算法 创新 大 赛 、 首 届 中 国 计 算 广告 学 大 赛 暨 RTB 算 法 大 赛 、RecSys Challenge 
2013 、ICDM Contest 2013 等 ,并 且 取 得 了 还 算 不 错 的 成 绩 。 无 一 例外 的 是 ,这 些 比赛 均 需要 对 数 
据 进行 快速 、 全 面 的 分 析 。 感 谢 NumPy， 它 正 是 我 们 使 用 的 数据 分 析 利 器 之 一 。 


本 书 作为 NumPy 的 入 门 教程 ， 从 安装 NumPy 讲 起 , 涵盖 NumPy 数 组 对 象 、 常 用 函数 、 和 矩阵 运 
算 、 线 性 代数 、 金 融 函 数 、 窗 函数 、 质 量 控制 、Matplotlib 绘 图 、SciPy 简 介 以 及 Pygame 等 内 容 ， 
涉及 面 较为 广泛 。 书 中 对 每 个 知识 点 均 给 出 了 简短 而 明晰 的 示例 , 很 适合 初学 者 上 手 。 大 部 分 示 
例 都 有 真实 的 应 用 场景 ( 如 股票 数据 分 析 )， 可 读 性 远 远 好 于 枯燥 的 官方 文档 ， 帮 助 读 者 在 掌握 
NumPy 使 用 技能 的 同时 拓宽 视野 、 拓 展 思维 。 本 书 的 阅读 门槛 不 高 ,读者 只 需 具备 基本 的 Python 
编程 知识 。 


在 翻译 本 书 的 过 程 中 , 我 发 现 原 作 有 不 少 地方 不 够 严谨 ,甚至 还 有 一 些 错 误 。 经 过 反复 核对 
确认 ,我 已 经 修改 了 发 现 的 错误 ,并 在 我 认为 不 够 严谨 的 地 方 以 译 者 注 的 形式 给 出 了 自己 的 理解 ， 
供 读者 参考 。 此 外 ， 原 书 中 的 配 图 为 屏幕 截图 ， 清 晰 度 较 低 。 为 了 读者 获得 最 佳 的 阅读 体验 ,我 
将 书 中 的 代码 全 部 运行 了 一 遍 ， 并 输出 矢量 图 以 替换 原 有 的 配 图 。 需 要 说 明 的 是 ， 书 中 部 分 代码 
将 会 在 线 下 载 最 近 一 年 的 股价 数据 ,， 即 数据 的 时 间 区 段 取决 于 代码 运行 时 的 日 期 。 因 此 ,这 部 分 
代码 对 应 的 新 配 图 会 与 原 书 中 的 配 图 稍 有 差异 ， 但 对 读者 不 会 有 任何 影响 。 
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感谢 我 的 研究 生 导 师 王 斌 老师 的 力荐 ,他 让 我 有 幸 成 为 本 书 的 译 者 。 王 老师 已 有 《信息 检索 
导论 》《 大 数据 : 大 规模 互联 网 数据 挖掘 与 分 布 式 处 理 》《 机 器 学 习 实 战 》 等 诸多 译 著 。 他 并 不 满 
足 于 自己 畅 读 国外 的 优质 书籍 , 而 是 字 其 句 酌 、 不 辞 辛劳 地 完成 同样 优质 的 译作 与 广大 中 文 读者 
共 给 ， 这 份 精神 让 我 深 受 鼓 舞 。 也 正 因为 此 ,我 才 茧 起 勇气 接受 了 这 次 自我 挑战 , 不遗余力 地 完 
成 了 人 生 第 一 次 翻译 工作 。 在 这 个 过 程 中 , 要 感谢 图 灵 公 司 的 李 松 峰 老 师 对 译 稿 提 出 细致 严谨 的 
修改 意见 ,感谢 傅 志 红 、 朱 狗 、 毛 倩 倩 、 程 其 等 出 版 界 同 仁 在 审 校 、 编 辑 阶 段 给 予 的 帮助 。 最 后 ， 
感谢 我 的 家 人 ， 以 及 BrickMover Team 的 小 伙伴 们 对 翻译 本 书 的 支持 。 

由 于 自己 的 专业 水 平和 翻译 能 力 十 分 有 限 , 加 上 时 间 人 仓促， 译 稿 中 的 疏漏 之 处 在 所 难免 ， 娠 
请 读者 谅解 。 希望 读者 通过 新 浪 微 博 @ 张 驭 宇 UCAS 和 个 人 邮箱 i@zhangyuyu.com, 不 音 提出 宝 
的 修改 意见 和 建议 ， 共 同 努 力 不 断 完善 译 稿 。 

对 于 每 一 个 期 望 快速 了 解 NumPy, 却 又 担心 自己 迷失 在 浩如烟海 的 官方 文档 中 的 人 , 这 本 书 
值得 一 读 。 




















Cb 


洒 


济 











张 驭 宇 
2013 年 11 月 于 中 关 村 
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献 给 我 的 家 人 和 朋友 们 。 
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关于 审 稿 人 

















Jaidev Deshpande 是 Enthought 公 司 的 一 位 实习 生 ， 他 在 那里 主要 做 数据 分 析 和 数据 可 视 化 
方面 的 工作 。 他 是 个 狂热 的 科学 计算 程序 员 , 在 信号 处 理 、 数 据 分 析 和 机 器 学 习 的 很 多 开源 项 目 
中 都 有 贡献 。 


Alexandre Devert 博 士 在 中 国 科学 技术 大 学 从 事 数据 挖掘 和 软件 工程 的 教学 工作 。 他 同时 也 
是 一 位 研究 员 ， 从事 最 优化 问题 的 研究 ， 并 在 生物 技术 创业 公司 中 研究 数据 挖掘 问题 。 在 所 有 这 
些 工作 中 ，Alexandre 非 常 乐 于 使 用 Python 、NumPy 和 SciPy。 


Mark Livingstone 曾 为 三 家 跨国 计算 机 公司 ( 如 今 已 不 复 存在 ) 工作 ,在 工程 、 产 品 支 持 、 
编程 和 培训 等 部 门 任职 。 他 厌倦 了 被 裁员 的 遭遇 。2011 年 ， 他 从 澳大利亚 黄金 海岸 的 Griffith 大 学 
毕业 ， 获 得 信息 技术 学 士 学 位 。 目 前 是 他 攻读 信息 技术 荣誉 学 士 学 位 的 最 后 一 个 学 期 ， 研 究 的 是 
蛋白 质 相关 的 算法 。 研 究 工作 中 用 到 的 软件 均 是 在 Mac 电 脑 上 用 Python 写成 的 。 他 的 导师 以 及 整 
个 研究 小 组 都 感受 到 了 Python 编程 的 乐趣 。 


Matk 喜 欢 指 导 需 要 帮助 的 大 一 新 生 ， 他 是 Griffith 大 学 IEEE 学 生 分 会 主席 ， 也 是 Courthouse 
地 区 的 太平 绅士 ， 曾 经 担任 过 信用 合作 社 的 主管 ， 并 将 在 2013 年 年 底 完成 100 次 献血 的 计划 。 


他 在 业余 时 间 也 很 多 产 , 曾 与 人 合作 开发 了 S2 Salstat Statistics Package( 项 目 主页 " :http:/code. 
google.com/p/salstat-statistics-package-2/ )。 这 是 一 个 跨 平台 的 统计 工具 包 ， 其 中 用 到 了 wxPython、 
NumPy、SciPy、SciKit、Matplotlib 等 许多 Python 模 块 。 


Miklos Prisznyak 是 一 位 有 自然 科学 背景 的 资深 软件 工程 师 。 他 毕业 于 匈牙利 历史 最 悠久 、 
规模 最 大 的 大 学 Etv6s L6rind 大 学 ， 从 事物 理 专业 工作 。 他 于 1992 年 完成 了 硕士 论文 ,研究 了 非 
阿 贝尔 的 唱 格 量子 场 论 的 蒙特 卡 罗 仿 真 。 在 匈牙利 物理 研究 中 心 工作 三 年 后 , 他 加 入 了 布 达 佩 划 
的 MultiRacio Kft。 这 家 公司 是 由 一 群 物理 学 家 创办 的 , 专注 于 用 数学 方法 分 析 数据 和 预测 经 济 数 
据 。 在 那里 ,他 的 主要 项 目 是 小 区 域内 的 失业 统计 分 析 系 统 ， 从 那 时 候 起 ， 这 一 系统 就 一 直 被 匈 
牙 利 政府 用 于 公共 就 业 服务 。2000 年 他 开始 学 习 Python 编 程 。2002 年 , 他 创办 了 自己 的 咨询 公司 ， 
将 Python 用 于 所 有 能 用 的 项 目 ， 服 务 于 各 种 各 样 的 保险 、 医 药 和 电子 商务 公司 。 他 还 曾 在 意大利 
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已 过 期 并 迁移 至 SourceForge: http://sourceforge.net/projects/s2statistical/。 一 一 译 者 注 
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2 关于 审 稿 人 





的 一 家 欧盟 研究 所 工作 ， 负 责 测 试 和 优化 基于 Python 的 Zope/Plone 分 布 式 网 络 应 用 程序 。2007 年 
他 移居 英国 ， 先 是 在 一 家 苏格兰 的 创业 公司 工作 ,使 用 Twisted Python; 随后 在 英国 航天 工业 部 
门 工 作 ， 使 用 PyQt 徐 口 工具 包 、Enthought 应 用 程序 框架 ， 以 及 NumPy 和 SciPy。2012 年 ， 他 回 到 
匈牙利 并 重新 加 入 MultiRicio， 目 前 的 工作 主要 涉及 OpenOffice/EuroOffice 上 的 Python 扩展 模块 ， 
并 再 次 使 用 NumPy 和 SciPy 来 让 用 户 求 解 非 线性 问题 和 随机 优化 问题 。Mikl6s 喜 欢 旅行 和 阅读 ， 
他 兴趣 广泛 ， 对 自然 科学 、 语 言 学 、 历 史 、 政 治 、 跳 棋 等 均 有 涉猎 。 香 浓 的 咖啡 是 他 的 最 爱 。 不 
过 ， 最 美好 的 莫 过 于 和 他 聪明 的 10 岁 大 的 儿子 Zsombor 一 起 享受 时 光 。 

Nikolay Karelin 拥 有 光学 博士 学 位 ， 有 近 20 年 利用 各 种 方法 进行 数值 仿真 和 分 析 的 经 验 ， 先 
后 在 学 术 界 和 工业 界 ( 从 事 光纤 通信 和 链 路 的 仿真 ) 工作 。 在 初 识 Python 和 NumPy 后 ， 他 在 过 去 的 
五 年 内 逐渐 将 这 些 优秀 的 工具 用 于 几乎 所 有 数值 分 析 和 脚本 编写 工作 。 





















































感谢 我 的 家 人 ， 感 谢 他 们 在 我 审阅 本 书 的 一 个 个 漫漫 长 夜 所 给 予 的 理解 与 支持 。 
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了 中 


前 


如 今 , 科学 家 、 工 程 师 以 及 定量 管理 分 析 师 面临 着 众多 的 挑战 。 数 据 科 学 家 们 希望 能 够 用 最 
小 的 编程 代价 在 大 数据 集 上 进行 数值 分 析 , 他 们 希望 自己 编写 的 代码 可 读 性 好 、 执 行 效 率 高 、 运 
行 速度 快 , 并 尽 可 能 地 贴近 他 们 熟悉 的 一 系列 数学 概念 。 在 科学 计算 领域 ， 有 很 多 符合 这 些 要 求 
的 解决 方案 。 


在 这 方面 ，C、C++ 和 Fortran 等 编程 语言 各 有 优势 ， 但 它们 不 是 交互 式 语言 ， 并 且 被 很 多 人 
认为 过 于 复杂 。 常 见 的 商业 产品 还 有 Matlab 、Maple 和 Mathematica。 这 些 产品 提供 了 强大 的 脚本 
语言 ， 但 和 通用 编程 语言 比 起 来 ， 功 能 依然 很 有 限 。 另 外 还 有 一 些 类 似 于 Matlab 的 开源 工具 ， 如 
R、GNU Octave 和 Scilab。 显 然 ， 作 为 编程 语言 ， 它 们 都 不 如 Python 强大 。 


Python 是 一 种 流行 的 通用 编程 语言 ， 在 科学 领域 被 广泛 使 用 。 你 很 容易 在 Python 代码 中 调用 
以 前 的 C、Fortran 或 者 R 代 码 。Python 是 面向 对 象 语言 ， 比 C 和 Fortran 更 加 高 级 。 使 用 Python 可 以 
写 出 易 读 、 上 整洁 并 日 缺陷 最 少 的 代码 。 人 然而，Python 本 身 并 不 具有 与 Matlab 等 效 的 功能 块 ， 而 这 
恰恰 就 是 NumPy 存 在 的 意义 。 本 书 就 是 要 介绍 NumPy 以 及 相关 的 Python 科学 计算 库 ， 如 SciPy 和 
Matplotlib 。 






















































































NumPy 是 什么 


NumPy (Numerical Python 的 缩写 ) 是 一 个 开源 的 Python 科学 计算 库 。 使 用 NumPy， 就 可 以 
很 自然 地 使 用 数组 和 和 抢 阵 。NumPy 包 含 很 多 实用 的 数学 函数 ,涵盖 线性 代数 运算 、 傅 里 叶 变换 和 
随机 数 生 成 等 功能 。 如 果 你 的 系统 中 已 经 装 有 LAPACK，NumPy 的 线性 代数 模块 会 调用 它 ， 和 否则 
NumPy 将 使 用 自己 实现 的 库 函 数 。LAPACK 是 一 个 著名 的 数值 计算 库 ， 最 初 是 用 Fortran 写 成 的 ， 
Matlab 同 样 也 需要 调用 它 。 从 某 种 意义 上 讲 ，NumPy 可 以 取代 Matlab 和 Mathematica 的 部 分 功能 ， 
并 且 人 允许 用 户 进 行 快 速 的 交互 式 原型 设计 。 

在 本 书 中 , 我 们 不 会 从 程序 开发 者 的 角度 来 讨论 NumPy， 而 是 更 多 地 立足 于 用 户 ， 从 他 们 的 
角度 来 分 析 它 。 不 过 值得 一 提 的 是 , NumPy 是 一 个 非常 活跃 的 开源 项 目 , 拥有 很 多 的 贡献 者 , 也 
许 有 一 天 你 也 能 成 为 其 中 的 一 员 ! 
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NumPy 的 由 来 


NumPy 的 前 身 是 Numeric。Numeric 最 早 发 布 于 1995 年 ， 如 今 已 经 废弃 了 。 由 于 种 种 原因 ,不 
管 是 Numeric 还 是 NumPy, 都 没 能 进入 Python 标准 库 , 不 过 单独 安装 NumPy 也 很 方便 。 关 于 NumPy 
的 安装 ， 我 们 将 在 第 1 章 中 详细 介绍 。 


早 在 2001 年 , 一 些 开 发 者 受 Numeric 的 启发 共同 开创 了 一 个 叫做 SciPy 的 项 目 。SciPy 是 一 个 开 
源 的 Python 科学 计算 库 ， 提 供 了 类 似 于 Matlab 、Maple 和 Mathematica 的 许多 功能 。 那 段 时 间 ， 人 
们 对 于 Numeric 越 来 越 不 满 。 于 是 , Numarray 作 为 Numeric 的 替代 品 问世 了 。 Numarray 在 某 些 方面 
比 Numeric 更 强大 ， 但 是 它们 的 工作 方式 却 截然 不 同 。 鉴 于 此 ，SciPy 继 续 遵 循 Numeric 的 工作 方 
式 ， 并 延续 了 对 Numeric 数 组 对 象 的 支持 。 虽 然 人 们 总 是 倾向 于 使 用 “最 新 最 好 ”的 软件 ， 但 是 
Numarray 依 然 俊生 出 了 一 整套 的 系统 ， 包 括 很 多 周边 的 实用 工具 软件 。 


2005 年 ，SciPy 的 早期 发 起 人 之 一 Travis Oliphant 决 定 改 变 这 一 状况 ， 他 开始 将 Numarray 的 一 
些 特性 整合 到 Numeric 中 。 一 整套 的 代码 重 构 工作 就 此 开始 ,并 于 2006 年 NumPy 1.0 发 布 的 时 候 全 
部 完成 。 于 是 NumPy 拥 有 了 Numeric 和 Numarray 的 所 有 特性 , 并且 还 新 增 了 一 些 功 能 。SciPy 提 供 
了 一 个 升级 工具 ， 可 以 让 用 户 方 便 地 从 Numeric 和 Numarray 升 级 到 NumPy。 由 于 Numeric 和 
Numarray 均 不 再 活跃 更 新 ， 升 级 是 必然 的 。 


如 上 所 述 ， 最 初 的 NumPy 其 实 是 SciPy 的 一 部 分 ， 后 来 才 从 SciPy 中 分 离 出 来 。 如 今 ，SciPy 
在 处 理 数组 和 和 矩阵 时 会 调用 NumpPy。 

































































为 什么 使 用 NumPy 


对 于 同样 的 数值 计算 任务 , 使 用 NumPy 要 比 直 接 编写 Python 代码 便捷 得 多 。 这 是 因为 NumPy 
能 够 直接 对 数组 和 和 珑 阵 进 行 操作 , 可 以 省 略 很 多 循环 语句 ,其 众多 的 数学 函数 也 会 让 编写 代码 的 
工作 轻松 许多 。NumPy 的 底层 算法 在 设计 时 就 有 着 优异 的 性 能 ， 并 且 经 受 住 了 时 间 的 考验 。 


NumPy 中 数组 的 存储 效率 和 输入 输出 性 能 均 远 远 优 于 Python 中 等 价 的 基本 数据 结构 ( 如 般 套 
的 list 容 器 )。 其 能 够 提升 的 性 能 是 与 数组 中 元 素 的 数目 成 比例 的 。 对 于 大 型 数组 的 运算 ,使 用 
NumPy 的 确 很 有 优势 。 对 于 TB 级 的 大 文件 ，NumPy 使 用 内 存 映 射 文件 来 处 理 ， 以 达到 最 优 的 数 
据 读 写 性 能 。 不 过 , NumPy 数 组 的 通用 性 不 及 Python 提供 的 list 容 器 ,这 是 其 不 足 之 处 。 因 此 在 科 
学 计算 之 外 的 领域 , NumPy 的 优势 也 就 不 那么 明显 了 。 关于 NumPy 数 组 的 技术 细节 , 我 们 将 在 后 
面 详细 讨论 。 


NumPy 的 大 部 分 代码 都 是 用 C 语 言 写成 的 ， 这 使 得 NumPy 比 纯 Python 代 码 高 效 得 多 。NumPy 
同样 支持 C 语 言 的 API， 并 且 人 允许 在 C 源 代码 上 做 更 多 的 功能 拓展 。C API 的 内 容 不 在 本 书 讨论 之 
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(We 








列 。 最 后 要 记 往 一 点 ，NumPy 是 开源 的 ， 这 意味 着 使 用 NumPy 可 以 享受 到 开源 带 来 的 所 有 益处 。 
价格 低 到 了 极限 一 一 免费 。 你 再 也 不 用 担心 每 次 有 新 成 员 加 入 团队 时 , 就 要 面 对 软 件 授 权 及 更 新 
的 问题 了 。 开 源 代码 是 向 所 有 人 开放 的 ， 对 于 代码 质量 而 言 这 是 非常 有 利 的 。 
































NumPy 的 局 限 性 


如 果 你 是 Java 程 序 员 ， 可 能 会 对 Jython 感 兴趣 。Jython 是 Python 语言 在 Java 中 的 完整 实现 。 遗 
憾 的 是 ，Jython 运 行 在 Java 虚 拟 机 上 ， 无 法 调用 NumPy， 因 为 大 部 分 NumPy 模 块 是 用 C 语 言 实现 
的 。Python 和 Jython 可 以 说 是 完全 不 同 的 两 个 世界 ， 尽 管 它们 实现 的 是 同一 套 语言 规范 。 当 然 ， 
仍然 有 一 些 变通 方案 ， 具 体内 容 在 本 书 作者 的 另 一 本 著作 《NumPy 攻 略 》 中 有 所 讨论 。 


























本 书 内 容 

第 1 章 指导 你 在 系统 中 安装 NumPy， 并 创建 一 个 基本 的 NumPy 应 用 程序 。 

第 2 章 介 绍 NumPy 数 组 对 象 以 及 一 些 基 础 知识 。 

第 3 章 教 你 使 用 NumPy 中 最 常用 的 基本 数学 和 统计 分 析 函 数 。 

第 4 章 讲述 如 何 便捷 地 使 用 NumPy， 包 括 如 何 选 取 数 组 的 某 一 部 分 ( 例如 根据 一 组 布尔 值 来 
选取 )、 多 项 式 拟 合 ， 以 及 操纵 NumPy 对 象 的 形态 。 

第 5 章 涵盖 了 和 矩阵 和 通用 也 数 的 内 容 。 算 阵 在 数学 中 使 用 广泛 ， 在 NumPy 中 也 有 专门 的 对 象 
来 表示 。 通 用 函数 (ufuncs ) 是 一 个 能 用 于 NumPy 对 象 的 标量 函数 ， 该 函数 的 输入 为 一 组 标量 ， 
并 将 生成 一 组 标量 作为 输出 。 

第 6 章 探 讨 通用 函数 的 一 些 基 本 模块 。 通 用 函数 通常 可 映射 到 对 应 的 数学 运算 ， 如 加 、 减 、 

第 7 章 介 绍 NumPy 中 的 一 些 专 用 函数 。 作 为 NumPy 用 户 ， 我 们 时 常 发 现 自己 有 一 些 特殊 的 需 
求 。 幸 运 的 是 ， NumPy 能 满足 我 们 的 大 部 分 需求 。 

第 8 章 介绍 怎样 编写 NumPy 的 单元 测试 代码 。 

第 9 章 深 入 介绍 非常 有 用 的 Python 绘图 库 Matplotlib 。 虽 然 NumPy 本 身 不 能 用 来 绘图 ， 但 是 
Matplotlib 和 NumPy 两 者 完美 地 结合 在 一 起 ， 其 绘图 能 力 可 与 Matlab 相 媲美 。 

第 10 章 更 详细 地 介绍 SciPy。 如 前 所 述 ，SciPy 和 NumPy 是 有 历史 渊源 的 ，SciPy 是 一 套 高 端 
Python 科学 计算 框架 ， 可 以 与 NumPy 共 同 使 用 。 
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第 11 章 是 本 书 的 “和 餐 后 甜点 ”， 这 一 章 介 绍 如 何 用 NumPy 和 Pygame 写 出 有 趣 的 游戏 。 同 时 ， 
我 们 也 将 从 中 “品尝 ”到 人 工 智 能 的 “滋味 ”。 


阅读 条 件 

要 试验 本 书 中 的 代码 ， 你 需要 安装 最 新 版 NumPy， 因 此 要 先 安装 能 够 运行 NumPy 的 任 一 版 
Python。 本 书 部 分 示例 代码 采用 Matplotlib 进 行 绘图 , 这些 代 码 不 一 定 需 要 读者 全 部 运行 , 但 依然 
推荐 安装 Matplotlib 。 本 书 最 后 一 章 讲 的 是 SciPy， 会 讨论 一 个 使 用 SciKits 的 例子 。 


以 下 是 开发 及 测试 示例 代码 所 需 的 软件 : 











口 Python 2.7 

口 NumPy 2.0.0.dev20100915 
口 SciPy 0.9.0.dev20100915 
口 Matplotlib 1.1.1 

口 Pygame 1.9.1 

口 IPython 0.14.dev 


当然 , 我 并 不 是 要 你 在 计算 机 上 装 全 这 些 软件 或 者 必须 装 指 定 版 本 , 但 Python 和 NumPy 是 必 
须 安装 的 。 




















读者 对 象 


本 书 适合 正在 找寻 高 质量 开源 数学 库 的 和 科学家、 工程师、 程序 员 和 分 析 师 阅读 参考 。 读 者 应 
具备 一 些 基 本 的 Python 编程 知识 。 此 外 ， 读 者 应 该 是 经 常 与 数学 和 统计 学 打交道 ， 或 起 码 对 它们 
感 



































排版 约定 
本 书 会 通过 不 同样 式 区 别 不 同类 型 的 内 容 。 下 面 给 出 部 分 样式 的 示例 及 解释 。 
正文 中 的 代码 格式 如 此 处 所 示 :“ 注 意 numpysum () 函数 中 没有 使 用 for 循 环 。” 
代码 段 如 下 所 示 : 











def numpysum(n): 
a = numpy.arange(n) ** 2 
b = numpy.arange (n) ** 3 
C=a+b 
return c 
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当 我 们 和 希望 你 注意 代码 中 的 某 一 部 分 时 ， 会 将 相关 的 行 或 项 用 粗 体 表示 : 


reals = np.isreal (xpoints) 
print "Real number?", reals 
Real number? [ True True True True False False False False ] 


命令 行 输入 输出 如 下 所 示 : 


>>>fromnumpy .testing import rundocs 
>>>rundocs('docstringtest .py') 


新 术语 和 重要 的 名 词 将 用 楷体 表示 。 你 在 屏幕 、 菜 单 或 对 话 框 中 看 到 的 文本 会 采用 加 粗 样式 : 
“ 单 击 Next 按 钮 进入 下 一 界面 。” 


| 警告 或 重要 说 明 将 写 在 这 里 。 ] 








< 
| 小 贴 士 和 技巧 将 写 在 这 里 。 | 


读者 反馈 

一 直 以 来 ,我 们 都 非常 欢迎 读者 朋友 的 意见 反馈 。 请 告诉 我 们 你 对 本 书 的 看 法 ， 以 及 你 
喜欢 还 是 不 喜欢 书 中 的 内 容 。 你 的 意见 对 我 们 非常 重要 ， 我 们 将 努力 使 你 从 阅读 中 得 到 最 大 
的 收获 。 

如 果 和 希望 提出 一 些 反馈 意见 , 敬 请 发 送 邮 件 至 feedback@packtpub.com, 并 请 在 邮件 标题 中 写 
上 书 名 [e) 

如 果 你 想 看 某 方面 的 书 并 希望 我 们 出 版 ， 请 通过 www.packtpub.com 上 的 SUGGEST A TITLE 
表单 提交 选 题 建议 ,或 发 送 邮 件 至 suggest@packtpub.com。 


如 果 你 是 某 个 领域 的 专家 ,或 有 兴趣 写 书 ， 欢 迎 访问 www.packtpub.com/authors， 里 面 有 我 
们 的 作者 指南 。 
































售后 支持 
感谢 你 购买 Packt 出 版 的 图 书 。 我 们 有 诸多 售后 支持 服务 ， 希 望 给 你 提供 最 大 的 附加 价值 。 








| 
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示例 代码 下 载 


如 果 你 是 www.packtpub.com 的 注册 用 户 并 从 那里 购买 了 图 书 , 可 以 从 网 站 上 下 载 配 套 的 示例 
代码 ?>。 如 果 你 是 在 别处 购买 了 本 书 ， 可 以 访问 www.packtpub.com/support 并 注册 ， 我 们 会 直接 将 
示例 代码 以 邮件 形式 发 送 给 你 。 


























勘误 


尽管 我 们 处 处 小 心 以 保证 图 书 内 容 的 准确 性 , 但 错误 仍 在 所 难免 。 如 果 你 在 阅读 过 程 中 发 现 
错误 并 告知 我 们 , 不 管 是 文字 还 是 代码 中 的 错误 ,我 们 都 将 不 胜 感激 。 这 样 做 可 使 其 他 读者 免 于 
困惑 ， 也 能 帮助 我 们 不 断 改进 后 续 版 本 。 如 果 你 发 现任 何 错误 ， 敬 请 访问 www.packtpub. 
com/support 报 告 给 我 们 ， 即 在 网 页 上 选择 你 购买 的 图 书 , 单 击 errata submission form ( 提交 勘误 ”) 
链接 ， 并 输入 详细 描述 。 一 旦 你 提出 的 错误 被 证 实 ， 你 的 勘误 将 被 接受 并 上 传 至 我 们 的 网 站 ， 或 
加 入 到 已 有 的 勘误 列表 中 。 车 要 查看 已 有 勘误 , 请 访问 www.packtpub.com/support 并 通过 书 名 查找 。 
























































关于 盗版 
在 网 上 , 所 有 媒体 都 会 遭遇 盗版 问题 Packt 非 常 重视 版 权 保护 工作 。 如果 你 在 网 上 发 现 Packt 
出 版 物 的 任何 非法 副本 ， 请 立即 向 我 们 提供 侵权 网 站 的 地 址 或 名 称 ， 以 便 我 们 采取 补救 措施 。 
敬 请 通过 copyright@packtpub.com 联 系 我 们 ， 告 知 涉嫌 侵权 内 容 的 链接 。 


我 们 非常 感激 你 的 帮助 。 这 将 保护 我 们 作者 的 利益 , 同时 也 使 我 们 有 能 力 继续 提供 高 品质 的 
内 容 。 





























疑难 解答 


如 果 对 本 书 的 任何 方面 有 疑问 ， 欢 迎 发 送 邮 件 至 questions@packtpub.com， 我 们 将 尽 最 大 努 
力 为 你 答疑 解 惑 。 
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让 我 们 开始 吧 。 首 先 , 我 们 将 介绍 如 何在 不 同 的 操作 系统 中 安装 NumPy 和 
相关 软件 ， 并 给 出 使 用 NumPy 的 简单 示例 代码 。 然 后 ， 我 们 将 简单 介绍 IPython 
(一 种 交互 式 shell 工 具 )。 如 前 言 所 述 ，SciPy 和 NumPy 有 着 密切 的 联系 ,因此 你 
将 多 次 看 到 SciPy 的 身影 。 在 本 章 的 末尾 ， 我 们 将 告诉 你 如 何 利用 在 线 资源 ， 以 
便 你 在 受 困 于 某 个 问题 或 不 确定 最 佳 的 解 题 方法 时 ， 可 以 在 线 获取 帮助 。 





本 章 涵盖 以 下 内 容 : 
口 在 Windows 、Linux 和 Macintosh 操 作 系 统 上 安装 Python 、SciPy 、Matplotlib 、IPython 和 
NumPy; 








口 编写 简单 的 NumPy 代 码 ; 
口 了解 IPython; 
口 浏览 在 线 文档 和 相关 资源 。 














1.1 Python 


NumPy 是 基于 Python 的 ， 因 此 在 安装 NumPy 之 前 ,我 们 需要 先 安装 Python。 某 些 操 作 系 统 已 
经 默认 安装 有 Python 环境 ， 但 你 仍 需 检 查 Python 的 版 本 是 否 与 你 将 要 安装 的 NumPy 版 本 兼容 。 
Python 有 很 多 种 实现 ， 包 括 一 些 商 业 化 的 实现 和 发 行 版 。 在 本 书 中 ， 我 们 将 使 用 CPython "实现 ， 
从 而 保证 与 NumPy 兼 容 。 











1.2 ”动手 实践 : 在 不 同 的 操作 系统 上 安装 Python 
NumPy 在 Windows、 各 种 Linux 发 行 版 以 及 Mac OS X 上 均 有 二 进 制 安装 包 。 如 果 你 愿意 ， 也 





Q@ CPython 是 用 C 语 言 实现 的 Python 解释 器 。 一 一 译 者 注 
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可 以 安装 包含 源 代码 的 版 本 。 你 需要 在 系统 中 安装 Python 2.4.x 或 更 高 的 版 本 。 我 们 将 给 出 在 以 下 
操作 系统 中 安装 Python 的 各 个 步骤 。 

(1) Debian 和 Ubuntu Debian 和 Ubuntu 可 能 已 经 默认 安装 了 Python ， 但 开发 者 包 ( development 
headers ) “一 般 不 会 默认 安装 。 在 Debian 和 Ubuntu 中 安装 python 和 python-dev 的 命令 如 下 : 


sudo apt-get install Python 
sudo apt-get install Python-dev 


(2) Windows Python 的 Windows 安 装 程序 可 以 在 www.python.org/download 下 载 。 在 这 个 站 点 
中 ， 我 们 也 可 以 找到 Mac OS X 的 安装 程序 ， 以 及 Linux、Unix 和 Mac OS X 下 的 源 代码 包 。 




















(3) Mac Mac OS X 中 预 装 了 Python ， 而 我 们 也 可 以 通过 MacPorts 、Fink 或 者 类 似 的 包 管 理工 
具 来 获取 Python。 举 例 来 说 ， 可 以 使 用 如 下 命令 安装 Python 2.7: 


sudo port install Python27 


LAPACK 并 不 是 必需 的 ， 但 如 果 需 要 ，NumPy 在 安装 过 程 中 将 检测 并 使 用 之 。 我 们 推荐 大 家 
安装 LAPACK 以 便 应 对 海量 数据 的 计算 ， 因 为 它 拥 有 高 效 的 线性 代数 计算 模块 。 




















刚才 做 了 些 什么 


我 们 在 Debian 、Ubuntu 、Windows 和 Mac 操 作 系 统 中 安装 了 Python。 


1.3 Windows 


在 Windows 上 安装 NumPy 是 很 简单 的 。 你 只 需要 下 载 安 装 程序 , 运行 后 在 安装 向 导 的 指导 下 








1.4 动手 实践 : 在 Windows 上 安装 NumPy、Matplotlib、 
SciPy 和 IPython 
在 Windows 上 安装 NumPy 是 必需 的 , 但 幸运 的 是 ,安装 过 程 并 不 复杂 , 我们 将 在 下 面 详细 阅 
述 。 建 议 你 安装 Matplotlib、SciPy 和 IPython， 昌 然 这 一 操作 对 于 使 用 本 书 不 是 必需 的 。 我 们 将 按 
照 如 下 步骤 安装 这 些 软件 。 


(1) 从 SourceForge 网 站 下 载 NumPy 的 Windows 安 装 程序 : 




















http://sourceforge.net/projects/numpy/files/ 























@ 该 软件 包 提供 编译 Python 模 块 所 需 的 静态 库 、 头 文件 以 及 distutils 工 具 等 。 一 一 译 者 注 
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Numerical Python 


a jarrodrnillrman， kerm.teoliphant 


YP 167 Recommendations Downlcag 
二 10.472 Downloads := Te 
多 Last Update: 2013-02-11 
7 机 Jrowse All Files 
WTiweet :4 区 +1 18 Vindik leuk 和 此 A How I 


Description 


Numerical Python adds a fast and sophisticated array facility to the Python language. NumPy is the most 
recent and most actively supported package. Numarray and Numeric are no longer supported 


请 选择 合 











适 的 版 本 。 在 上 图 中 ， 我 们 选择 了 numpy-1.7.0-win32-superpack-python2.7.exe。 
(2) 下 载 完成 后 ， 双 击 运行 安装 程序 。 





Setup 


This Wizard will install numpy on your computer. Click Next to continue or 
Cancel to exit the Setup Wizard. 


NumPy is a general-purpose array-processing package designed to 

efficiently manipulate large multi-dimensional arrays of arbitrary 

records without sacrificing too much speed for small multidimensional 

arrays. NumPy is built on the Numeric code base and adds features 

introduced by numarray as well as an extended C-sP| and the ability to 

create arrays of arbitrary type Which also makes NumPy suitable for 
PYTHON interfacing with general-purpose data-base applications, 
POWered 


There are also basic facilities for discrete fourier transform, 
basic linear algebra and random number generation. 





Suthor: Travis E. Dliphant, et.al. 
A&uthor_email: oliphanttSenthought.com 


4 Je 
BultsatMar131z10002012 with distutils-2.7 











Ts em | 


(3) 现在 , 我 们 可 以 看 到 一 段 对 NumPy 的 描述 以 及 其 特性 ， 如 上 图 所 示 。 单 击 Next (下 一 步 ) 
按钮 以 继续 安装 。 


(4) 如 果 你 已 经 安装 了 Python，NumPy 的 安装 程序 应 该 能 自动 检测 到 。 如 果 没 有 检测 到 Python， 


可 能 是 你 的 路 径 设 置 有 误 。 在 本 章 的 末尾 , 我 们 列 出 了 一 些 在 线 资源 ， 供 安装 NumPy 时 遇 到 问题 
的 读者 参考 。 
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E Setup [Ez | 











Python 2.7 is regquired for this package. Select installation to use: 


PYTHON 


[| 





Pythaen Directory: 


Installation Directory: [ESPwthonz7ALibvsitepackagesA 








<Bsck Next > Cancel 





(5) 在 上 图 中 , 安装 程序 成 功 检测 到 系统 中 已 安装 Python 2.7, 此 时 应 单 击 Next 按 钮 继续 安装 ; 
否则 ， 请 单 击 Cancel ( 取消 ) 按钮 并 安装 Python ( NumPy 不 能 脱离 Python 单独 安装 )。 继 续 单 击 
Next 按 钮 ， 从 这 一 步 起 就 不 能 回 退 到 上 一 步 了 , 因此 请 你 确认 是 否 选择 了 合适 的 安装 路 径 和 其 他 
安装 选项 。 现 在 ， 真 正 的 安装 过 程 开 始 了 ， 你 需要 等 待 一 段 时 间 。 


(6) SciPy 和 Matplotlib 可 以 通过 Enthough 安 装 ， 地 址 为 www.enthought.comy/products/epd.php。 
在 安装 过 程 中 , 你 可 能 需要 将 一 个 文件 msvep71.dll 放 到 目录 C:\Windows\system32 下 。 你 可 以 从 这 
里 下 载 这 个 文件 : www.dll-files.com/dllindex/dll-files.shtml?msvcp71。Windows 下 的 IPython 安 装 程 
序 可 以 通过 访问 IPython 的 官网 下 载 : http://ipython.scipy.org/Wiki/IpythonOnWindows。 


刚才 做 了 些 什么 


我 们 在 Windows 上 安装 了 NumPy、SciPy、Matplotlib 以 及 IPython。 


1.5 Linux 


在 Linux 上 安装 NumPy 和 相关 软件 的 方法 取决 于 具体 使 用 的 Linux 发 行 版 。 我 们 将 用 命令 行 的 
方式 安装 NumPy， 不 过 你 也 可 以 使 用 图 形 界面 安装 程序 ， 这 取决 于 具体 的 Linux 发 行 版 。 除 了 软 
件 包 的 名 字 不 一 样 ， 安 装 Matplotlib 、SciPy 和 IPython 的 命令 与 安装 NumPy 时 是 完全 一 致 的 。 这 几 
个 软件 包 不 是 必需 安装 的 ， 但 这 里 建议 你 也 一 并 安装 。 
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1.6 


动手 实践 : 在 Linux 上 安装 NumPy、Matplotlib 、SciPy 
和 IPython 


大 部 分 Linux 发 行 版 都 有 NumPy 的 软件 包 。 我 们 将 针对 一 些 流行 的 Linux 发 行 版 给 出 安装 步骤。 


(1) 要 在 Red Hat 上 安装 NumPy， 请 在 命令 行 中 执行 如 下 命 

yum install python-numpy 

(2) 要 在 Mandriva 上 安装 NumPy， 请 在 命令 行 中 执行 如 下 命令 

urpmi python-numpy 

(3) 要 在 Gentoo 上 安装 NumPy， 请 在 命令 行 中 执行 如 下 命 

sudo emerge numpy 

(4) 要 在 Debian 或 Ubuntu 上 安装 NumPy， 请 在 命令 行 中 执行 如 下 命令 


sudo apt-get install python-numpy 


下 表 给 出 了 各 Linux 发 行 版 中 相关 软件 包 的 名 称 以 供 参 考 。 








Linux 发 行 版 NumPy SciPy Matplotlib IPython 
Arch Linux python-numpy python-scipy python-matplotlib ipython 
Debian python-numpy python-scipy python-matplotlib ipython 
Fedora numpy python-scipy python-matplotlib ipython 
Gentoo dev-python/numpy scipy matplotlib ipython 
OpenSUSE python-numpy,python-numpy-devel python-scipy python-matplotlib ipython 
Slackware numpy scipy matplotlib ipython 
刚才 做 了 些 什 么 


1.7 


我 们 在 各 种 Linux 发 行 版 上 安装 了 NumPy、SciPy、Matplotlib 以 及 IPython。 


Mac OS X 
在 Mac 上 ， 你 可 以 通过 图 形 用 户 界面 或 者 命令 行 来 安装 NumPy、Matplotib 和 SciPy， 根 据 自 





已 的 喜好 选择 包 管 理工 具 ， 如 MacPorts 或 Fink 等 。 








1.8 


动手 实践 : 在 Mac OS X 上 安装 NumPy、Matplotlib 和 SciPy 
我 们 将 使 用 图 形 用 户 界 面 安装 程序 ， 安 装 步 又 如 下 所 示 。 
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(1) 我 们 先 从 SourceForge 页 面 下 载 NumPy 的 安装 程序 ， 地 址 为 http://sourceforge.net/projects/ 
numpy/files/。Matplotlib 和 SciPy 也 可 以 用 类 似 的 方式 下 载 , 只 需 将 前 面 URL 中 的 numpy 修 改 为 scipy 
或 matplotlib。 在 我 写作 本 书 的 时 候 ，IPython 还 没有 提供 图 形 界面 的 安装 程序 。 如 下 面 的 截图 所 
示 ， 请 单 击 下 载 合适 的 DMG 文 件 ， 量 通常 要 选择 最 新 版 本 的 文件 。 








Looking for the latest version? Download numpy-1.7.0.zip (3.1 MB) 

Home f 
Modified .. Downloads 

Names Size * 

全 全 

Q NumPy 2013-02-10 有 

”Old Numarray 2006-08-24 

°° Old Numeric 2005-11-13 

Totals: 3 Items 








@Q2) 打开 下 载 的 DMG 文 件 (示例 中 为 numpy-1.7.0-py2.7-python.org-macosx10.6.dmg )， 如 下 图 
所 示 。 





Numpy 


The fundamental package 
needed for 

scientific computing 
with Python 









Documentation 


Double-click to install To know more about 
numpy 








口 在 打开 的 窗口 中 , 双击 那个 下 方 文字 以 .mpkg 结 尾 的 图 标 , 我 们 将 看 到 安装 程序 的 欢迎 界面 。 
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口 单 击 Continue (继续 ) 按钮 进入 Read Me ( 自述 页 ) 界面 ， 我 们 将 看 到 一 小 段 NumPy 的 描 
述 文字 ， 如 下 图 所 示 。 


HAA 二 Install numpy 1.7.0 





Important Information 


NumPy is the fundamental package needed for scientific computing with 
Python. 
This package contains: 


© Introduction 





© Read Me 

wk * a powerful N-dimensional array object 
里 License * sophisticated (broadcasting) functions 

~ ”tools for integrating C/C++ and Fortran code 

estiria 有 SE ” 
人 让 | ey ™ Useful linear algebra, Fourier transform, and random number 
@ Installai noe capabilities. 
©® Instalition lt derives from the old Numeric code base and can be used as a 


replacemeni for Numeric. lt also adds the features introduced by 
numarray and can be used to replace numarray. 


- np 
人 Nary | 

‘wp 内 muary LL 和 

More information can be found at the website: 

a http://scipy.org/NumPy 


Afterinstallation, tests can be run with: 


> python -c import numpy; numpy.test()' 
pb ’ Starting in NumPy 1.7, deprecation warnings have been set to raise' by 
Print,.. Save... Co Back Continue 








口 单 击 Continue 按 钮 ， 可 以 看 到 关于 软件 许可 协议 的 说 明 。 


(3) 阅读 软件 许可 协议 ， 单 击 Continue 按 钮 ， 在 被 提示 是 否 接受 协议 时 单 击 Accept ( 同意 ) 
按钮 。 继 续 安 装 ， 最 后 单 击 Finish ( 完成 ) 按钮 结束 安装 。 





刚才 做 了 些 什么 








我 们 在 Mac OS X 上 用 图 形 用 户 界 面 安装 程序 安装 了 NumPy。SciPy 和 Matplotlib 的 安装 步骤 与 
之 很 类 似 ， 使 用 上 面 第 (1) 步 中 提 到 的 URL 进 行 下 去 即 可 。 





1.9 动手 实践 : 使 用 MacPorts 或 Fink 安装 NumPy、SciPy、 
Matplotlib 和 IPython 


我 们 也 可 以 选择 另外 一 种 安装 方式 , 即使 用 MacPorts 或 Fink 来 安装 NumPy、SciPy、Matplotlib 
以 及 IPython。 下 面 给 出 的 安装 步骤 将 安装 所 有 这 些 软件 包 。 在 本 书 中 只 有 NumPy 是 必需 的 ， 如 
果 你 对 其 他 软件 包 不 感 兴趣 ， 也 可 以 暂 不 安装 。 
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(D 输入 以 下 命令 ， 从 MacPorts 安 装 这 些 软件 包 : 
sudo port install py-numpy py-scipy py-matplotlib py-ipython 
(2) Fink 也 包含 了 相关 软件 包 : NumPy 的 有 scipy-core-py24 、scipy-core-py25 和 


scipy-core-py26; SciPy 的 有 scipy-py24、scipy-py25 和 scipy-py26。 执行 如 下 命令 , 我 
们 来 安装 基于 Python 2.6 的 NumPy 以 及 其 他 推荐 安装 的 软件 包 : 





fink install scipy-core-py26 scipy-py26 matplotlib-py26 


刚才 做 了 些 什 么 


我 们 在 Mac OS X 上 使 用 MacPorts 和 Fink 安 装 了 NumPy 以 及 其 他 推荐 安装 的 软件 包 。 





1.10 编译 源 代码 
NumPy 的 源 代码 可 以 使 用 git 获 取 ， 如 下 所 示 : 








git clone git://github.com/numpy/numpy.git numpy 
使 用 如 下 命令 将 NumPy 安 装 至 /ust/local: 


python setup.py build 
sudo python setup.py install --prefix=/usr/local 


我 们 需要 有 C 编 译 器 ( 如 GCC ) 和 Python 开 发 者 包 (python-dev 或 python-devel )， 然 后 
才 可 对 源 代码 进行 编译 。 


1.11 数组 对 象 


在 介绍 完 NumPy 的 安装 步 又 后 ， 我 们 来 看 看 NumPy 中 的 数组 对 象 。NumPy 数 组 在 数值 运算 
方面 的 效率 优 于 Python 提 供 的 list 容 磊 。 使 用 NumPy 可 以 在 代码 中 省 去 很 多 循环 语句 , 因此 其 代码 
比 等 价 的 Python 代码 更 为 简洁 。 


1.12 ”动手 实践 : 向 量 加 法 


假设 我 们 需要 对 两 个 向 量 a 和 ?pb 做 加 法 。 这 里 的 向 量 即 数学 意义 上 的 一 维 数组 ， 随 后 我 们 将 
在 第 $ 章 中 学 习 如 何 用 NumPy 数 组 表示 和 珑 阵 。 向 量 a 的 取 值 为 0~z 的 整数 的 平方 ， 例 如 n 取 3 时 ， 向 
量 a 为 0、1 或 4。 向 量 b 的 取 值 为 0~n 的 整数 的 立方 ， 例 如 n 取 3 时 ， 向 量 b 为 0、1 或 8。 用 纯 Python 
代码 应 该 怎么 写 呢 ?我 们 先 想 一 想 这 个 问题 ， 随 后 再 与 等 价 的 NumPy 代 码 进行 比较 。 
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(1) 以 下 的 纯 Python 代 码 可 以 解决 上 述 问题 : 


def Pythonsum () : 
a = range(n) 
b = range(n) 


[] 

for i in range(len(a)): 
a[i] = i ** 2 
oY Pe il Ee i} 
c.append(a[i] + br[i]) 

return c 


(2) 以 下 是 使 用 NumPy 的 代码 ， 它 同样 能 够 解决 问题 : 


def numpysum(n): 








a = numpy.arange(n) ** 2 
b = numpy.arange(n) ** 3 
C=a+b 

return c 


注意 ,numpysum() 函数 中 没有 使 用 for 循 环 。 同 时 , 我 们 使 用 NumPy 中 的 arange 函 数 来 创 
建 包含 0~ 的 整数 的 NumPy 数 组 , 代码 中 的 arange 函 数 前 面 有 一 个 前 缀 numpy, 表明 该 函数 是 从 
NumPy 模 块 导入 的 。 





下 面 我 们 做 一 个 有 趣 的 实验 。 在 前 言 部 分 我 们 曾 提 到 ,NumPy 在 数组 操作 上 的 效率 优 于 纯 
Python 代 码 。 那么 究竟 快 多 少 呢 ?” 接 下 来 的 程序 将 告诉 我 们 答案 , 它 以 微 秒 (10*s ) 的 精度 分 别 
记录 下 numpysum() 和 pythonsum() 函数 的 耗 时 。 这 个 程序 还 将 输出 加 和 后 的 向 量 最 末 的 两 个 元 
素 。 让 我 们 来 看 看 纯 Python 代 码 和 NumPy 代 码 是 否 得 到 相同 的 结 











#!/usr/bin/env/python 


import sys 
from datetime import datetime 
import numpy as np 


本 书 第 1 章 
该 段 代码 演示 Python 中 的 向 量 加 法 
使 用 如 下 命令 运行 程序 : 

Python vectorsum.py n 


nn 为 指定 向 量 大 小 的 整数 


加 法 中 的 第 一 个 向 量 包 含 0 到 n 的 整数 的 平方 
第 二 个 向 量 包 含 0 到 n 的 整数 的 立方 
程序 将 打印 出 向 量 加 和 后 的 最 后 两 个 元 素 以 及 运行 消耗 的 时 间 
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j 


def numpysum(n 


a = np.arange(n) ** 2 
b = np.arange(n) ** 3 
C=a+b 
return c 
def pythonsum(n): 
a = range(n) 
b = range(n) 
c= [] 
for i in range(len(a)): 
a[i] = i ** 2 
访 [ 主 ] 半生 类 类 33 
c.append(a[i] + b[i]) 
return c 
size = int(sys.argv[1]) 
start = datetime.now!() 
C = pythonsum(size) 
delta = datetime.now() - start 
print "The last 2 elements of the sum", cI[-2: 
print "PythonSum elapsed time in microseconds", 
start = datetime.now!() 
C = numpysum(size) 


delta = datetime.now() - start 
print "The last 2 elements of the sum", c[-2 
print "NumPySum elapsed time in microseconds", 


各 





$ python vectorsum.py 1000 

The last 2 elements of the sum [995007996, 

PythonSum elapsed time in microseconds 707 
The last 2 elements of the sum [995007996 9 
NumPySum elapsed time in microseconds 171 


$ python vectorsum.py 2000 

The last 2 elements of the sum [7980015996, 
PythonSum elapsed time in microseconds 1420 
The last 2 elements of the sum [7980015996 
NumPySum elapsed time in microseconds 168 


$ Python vectorsum.py 4000 

The last 2 elements of the sum [63920031996 
PythonSum elapsed time in microseconds 2829 
The last 2 elements of the sum [63920031996 
NumPySum elapsed time in microseconds 274 
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] 


delta.microseconds 


1] 


delta.microseconds 


序 在 向 量 元 素 个 数 为 1000、2000 和 3000 时 的 输出 分 别 为 : 


998001000] 


98001000] 


7992002000] 


7992002000] 


63968004000] 


了 


63968004000] 
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1.13 ”IPython: 一 个 交互 式 shell 工具 11 





ul 如 果 你 是 www.packtpub.com 的 用 户 并 从 那里 购买 了 图 书 ， 可 以 从 网 站 上 下 
载 配套 的 示例 代码 。 如 果 你 是 在 别处 购买 了 本 书 ， 可 以 访问 www.packtpub.com/ 
support 进 行 登记 ， 我 们 会 直接 将 示例 代码 文件 以 邮件 形式 发 送 给 你 。 


刚才 做 了 些 什么 





显然 ,NumPy 代 码 比 等 价 的 纯 Python 代 码 运 行 速度 快 得 多 。 有 一 点 可 以 肯定 ， 即 不 论 我 们 使 
用 NumPy 还 是 Python， 得 到 的 结果 是 一 致 的 。 不 过 ， 两 者 的 输出 结果 在 形式 上 有 些 差异 。 注 意 ， 
numpysum() 函数 的 输出 不 包含 逗号 。 这 是 为 什么 呢 ? 显然 ， 我 们 使 用 的 是 NumPy 数 组 ， 而 非 
Python 自身 的 list 容 器 。 正 如 前 言 中 所 述 , NumPy 数 组 对 象 以 专用 数据 结构 来 存储 数值 。 我 们 将 在 
一 章 中 详细 介绍 NumPy 数 组 对 象 。 





























突击 测验 : arange 函 数 的 功能 





问题 1 arrange (5) 的 作用 是 什么 ? 

| 建 一 个 包含 5 个 元 素 的 Python 列 表 (list )， 取 值 分 别 为 1~5 的 整数 
| 建 一 个 包含 S 个 元 素 的 Python 列表 ， 取 值 分 别 为 0~4 的 整数 

(3) 创建 一 个 包含 5 个 元 素 的 NumPy 数 组 ， 取 值 分 别 为 1~5 的 整数 

(4) 创建 一 个 包含 5 个 元 素 的 NumPy 数 组 ， 取 值 分 别 为 0~4 的 整数 

(5) 以 上 都 不 对 





勇敢 出 发 : 进一步 分 析 
我 们 用 来 比较 NumPy 和 常规 Python 代码 运行 速度 的 程序 不 是 特别 严谨 ,如果 将 相同 的 实验 
重复 多 次 并 计算 相应 的 统计 量 ( 如 平均 运行 时 间 等 ) 会 更 科学 。 你 可 以 把 实验 结果 绘制 成 图 表 ， 
并 展示 给 你 的 好 友和 同事 。 





yy 我 们 在 本 章 的 最 后 给 出 了 一 些 在 线 文档 和 相关 资源 ， 你 可 以 在 线 获取 帮助 。 
顺便 提 一 下 ，NumPpy 中 的 统计 函数 可 以 帮 你 计算 平均 数 。 建 议 你 使 用 Matplotlib 
绘图 。( 第 9 章 概述 了 Matplotlib 。) 


1.13 1IPython: 一 个 交互 式 shell 工具 


科学 家 和 工程 师 都 喜欢 做 实验 ， 而 IPython 正 是 诞生 于 爱 做 实验 的 科学 家 之 手 。IPython 提 供 
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的 交互 式 实验 环境 被 很 多 人 认为 是 Matlab、Mathematica 和 Maple 的 开源 替代 品 。 你 可 以 在 线 获取 











包括 


作者 
者 唯 


我 们 


安装 指南 在 内 的 更 多 信息 ， 地 址 为 http://ipython.org/。 


IPython 是 开源 免费 的 软件 ， 可 以 在 Linux、Unix、Mac OS 义 以 及 Windows 上 使 用 。IPython 的 
们 希望 那些 用 到 IPython 的 科研 工作 成 果 在 发 表 时 能 够 提 到 IPython， 这 是 他 们 对 IPython 使 用 
一 的 要 求 。 下 面 是 IPython 的 基本 功能 : 


口 Tab 键 自动 补 全 ; 

口 历史 记录 存档 ; 

口 行内 编辑 ; 

口 使 用 srun 可 以 调用 外 部 Python 脚本 ; 

口 支持 系统 命令 ; 

口 支持 pylab 模 式 ; 

口 Python 代码 调试 和 性 能 分 析 。 

在 pylab 模 式 下 , IPython 将 自动 导入 sciPy、NumPy 和 Matplot1ib 模 块 。 如 果 没 有 这 个 功能 ， 
只 能 手动 导入 每 一 个 所 需 模块 。 

而 现在 ， 我 们 只 需 在 命令 行 中 输入 如 下 命令 : 
$ ipython --pylab 


Python 2.7.2 (default, Jun 20 2012, 16:23:33) 
Type "copyright", "credits" or "license" for more information. 






































IPython 0.14.dev -- An enhanced Interactive Python. 

? -> Introduction and overview of IPython's features. 
%quickref -> Quick reference. 

help -> Python's own help system. 

object? -> Details about 'object', use 'object??' for extra details. 


Welcome to pylab, a matplotlib-based Python environment [backend: MacOSX]. 
For more information, type 'help(pylab)'. 
In [1]: Guit() 


使 用 guit () 函数 或 快捷 键 Ctrl+D 均 可 以 退出 卫 ython shell。 有 时 我 们 想 要 回 到 之 前 做 过 的 实 
IPython 可 以 便捷 地 保存 会 话 以 便 稍 后 使 用 。 


In [1]: %logstart 

Activating auto-logging. Current session state plus future input saved. 
Filename : ipython log.py 

Mode : rotate 

Output logging : False 

Raw input log : False 

Timestamping : False 

State : active 


举例 来 说 ， 我 们 将 之 前 的 向 量 加 法 程序 放 在 当前 目录 下 ， 可 以 按照 如 下 方式 运行 脚本 : 
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In [1]: 1s 
README Vvectorsum.py 


In [2]: %run -i vectorsum.py 1000 


你 可 能 还 记得 , 这 里 的 1000 是 指向 量 中 元 素 的 数量 。%run 的 -gd 参数 将 开启 ipab 调 试 器 , 键 
入 c 后 ， 脚 本 就 开始 逐 行 执行 了 ( 如 果 脚 本 有 n 行 ， 就 一 共 执 行 n 步 直到 代码 结束 )。 在 ipab 提 示 
符 后 面 键入 quit 可 以 关闭 调试 器 。 











In [2]: %run -d vectorsum.py 1000 

*** Blank or comment 

*** Blank or comment 

Breakpoint 1 at: /Users/.../vectorsum.py:3 


在 ipdb> 提 示 符 后 面 键 入 c， 从 而 开始 运行 代码 。 


><string>(1) <module>() 

ipdb> c 

> /Users/.../vectorsum.py(3)<module>() 
1 

1---> 3 import sys 
4 from datetime import datetime 

ipdb> n 

> 

/Users/.../vectorsum.py(4)<module>() 

1 3 import sys 

----> 4 from datetime import datetime 
5 import numpy 

ipdb> n 

> /Users/.../vectorsum.py(5)<module>() 
4 from datetime import datetime 

----> 5 import numpy 
6 

ipdb> quit 


我 们 还 可 以 使 用 %run 的 -p 参 数 对 脚本 进行 性 能 分 析 。 


In [4]: %run -p vectorsum.py 1000 
1058 function calls (1054 primitive calls) in 0.002 CPU seconds 
Ordered by: internal time 
ncallstottimepercallcumtimepercallfilename:lineno(function) 


1 0.001 0.001 0.001 0.001 vectorsum.py:28(pythonsum) 

1 0.001 0.001 0.002 0.002 {execfile} 

1000 0.000 0.0000.0000.000 {method "append" of 'list' objects} 
10.000 0.000 0.002 0.002 vectorsum.py:3(<module>) 

1 0.000 0.0000.0000.000 vectorsum.py:21 (numpysum) 

3 0.000 0.0000.0000.000 {range} 

1 0.000 0.0000.0000.000 arrayprint .py:175( array2string) 
3/1 0.000 0.0000.0000.000 arrayprint .py:246(array2string) 

这 0.000 0.0000.0000.000 {method 'reduce' of 'numpy.ufunc' objects} 
4 0.000 0.0000.0000.000 {built-in method now} 

2 0.000 0.0000.0000.000 arrayprint .py:486( formatlnteger) 

| 0.000 0.0000.0000.000 {numpy .core.multiarray.arange} 

和 0.000 0.0000.0000.000 arrayprint .py:320(_ formatArray) 
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3/1 0.000 0.0000.0000.000 numeric.py:1390(array_ str) 
证 0.000 0.0000.0000.000 numeric.py:216(asarray) 
2 0.000 0.0000.0000.000 arrayprint .py:312( extendLine) 
1 0.000 0.0000.0000.000 fromnumeric.py:1043 (ravel) 
2 0.000 0.0000.0000.000 arrayprint .py:208(<lambda>) 
1 0.000 0.000 0.002 0.002<string>:1(<module>) 
11 0.000 0.0000.0000.000 {len} 
2 0.000 0.0000.0000.000 {isinstance} 
1 0.000 0.0000.0000.000 {reduce} 
1 0.000 0.0000.0000.000 {method 'ravel' of 'numpy.ndarray' objects} 
4 0.000 0.0000.0000.000 {method 'rstrip' of 'str' objects} 
3 0.000 0.0000.0000.000 {issubclass} 
2 0.000 0.0000.0000.000 {method 'item' of ‘numpy.ndarray' objects} 
1 0.000 0.0000.0000.000 {max} 
1 0.000 0.0000.0000.000 {method 'disable' of ' lsprof.Profiler' 
objects} 





根据 性 能 分 析 的 结果 ， 可 以 更 多 地 了 解 程序 的 工作 机 制 ， 并 能 够 据 此 找到 程序 的 性 能 瓶颈 。 
使 用 shi st 命令 可 以 查看 命令 行 历史 记录 。 


In [2]: a=2+2 

In [3]: a 

Out[3]: 4 

In [4]: %hist 

1: _ip.magic("hist ") 
2: a=2+2 

3: a 


通过 前 面 的 介绍 ， 











Ey 








希望 你 也 认为 IPython 是 非常 有 用 的 工具 了 1! 


1.14 在 线 资源 和 帮助 


在 IPython 的 pylab 模 式 下 ， 我 们 可 以 使 用 help 命 令 打 开 NumPy 函 数 的 手册 页 面 。 你 并 不 需要 
知道 所 有 函数 的 名 字 ， 因 为 可 以 在 键入 少量 字符 后 按 下 Tab 键 进行 自动 补 全 。 例 如 ， 我 们 来 查看 
一 下 arange 孙 数 的 相关 信息 。 


In [2]: help ar<Tab> 




















argsort 
argwhere 
around 
array 
array2string 


array_equal 
array_equiv 
array_repr 
array_split 
array_str 


arctan arrow 


arctan2 


arctanh 
argmax 
argmin 














In [2]: help arange 
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另 一 种 方法 是 在 函数 名 后 面 加 一 个 问号 : 





In [3]: arange? 
可 以 访问 http:/docs.scipy.org/doc/ 查 看 NumPy 和 SciPy 的 在 线 文档 。 在 这 个 网 页 上 ， 你 可 以 访 
问 http://docs.scipy.org/doc/mumpy/reference/ 浏 览 NumPy 的 参考 资料 、 用 户 指南 以 及 一 些 使 用 教程 。 
NumPy 的 wiki 站 点 上 也 有 许多 相关 文档 可 供 参 考 : http://docs.scipy.org/numpy/Front%20Page/。 
NumPy 和 SciPy 的 论坛 地 址 为 http://ask.scipy.org/en。 


广 受 欢迎 的 开发 技术 问答 网 站 Stack Overflow 上 有 成 百 上 千 的 提问 被 标记 为 numpy 相 关 问 
题 。 你 可 以 到 这 里 查看 这 些 问 题 : http://stackoverflow.com/questions/tagged/numpy。 


如 果 你 确实 被 某 个 问题 困 住 了 ， 或 者 想 了 解 NumPy 开 发 的 最 新 进展 ， 可 以 订阅 NumPy 的 讨 
论 组 邮件 列表 ， 电 子 邮 件 地 址 为 numpy-discussion@scipyorg。 每 天 的 邮件 数量 不 会 太 多 ， 并 且 基 
本 不 会 讨论 无 意义 的 事情 。 最 重要 的 是 ,NumPy 的 活跃 开发 者 们 也 愿意 回答 讨论 组 里 提出 的 问题 。 
完整 的 邮件 列表 可 以 在 这 里 找到 : www.scipy.org/Mailing_Lists。 
































对 于 IRC”" 的 用 户 ， 可 以 查看 irc.freenode.net 上 的 了 RC 频 道 。 尽 管 该 频道 的 名 称 是 #scipy， 但 
你 也 可 以 提出 NumPy 的 问题 ,因为 SciPy 是 基于 NumPy 的 ,SciPy 的 用 户 也 了 解 NumPy 的 知识 .SciPy 
频道 上 至 少 会 有 5$0 人 同时 在 线 。 


1.15 ”本 章 小 结 


在 本 章 中 , 我 们 安装 了 NumPy 以 及 其 他 推荐 软件 。 我 们 成 功 运行 了 向 量 加 法 程序 , 并 以 此 证 
明了 NumPy 优 异 的 性 能 。 随 后 ,我 们 介绍 了 交互 式 shell 工 具 IPython。 此 外 ,我 们 还 列 出 了 供 你 参 
考 的 NumPy 文 档 和 在 线 资源 。 


在 下 一 章 中 ,我们 将 深入 了 解 NumPy 中 的 一 些 基 本 概念 ,包括 数组 和 数据 类 型 。 














Q@ Internet Relay Chat, 一 种 公开 的 协议 ， 用 于 网 络 即时 聊天 。 一 一 译 者 注 
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第 2 章 


NumPy 基 础 








在 上 一 章 中 我 们 学 习 了 NumPy 的 安装 ， 并 试 着 运行 了 一 些 代码 。 现 在 ， 
让 我 们 正式 学 习 NumPy 的 基础 知识 吧 。 


本 章 涵 盖 以 下 内 容 : 
口 数据 类 型 ; 
口 数组 类 型 ; 
口 类 型 转换 ; 
口 创建 数组 ; 
口 数组 索引 ; 
口 数组 切片 ; 
口 改变 维度 。 


不 过 , 在 正式 学 习 之 前 , 我 想 就 本 章 中 的 示例 代码 做 一 些 说 明 。 本 章 代码 段 中 的 输入 和 输出 
均 来 自 IPython 会 话 。 我 们 曾 在 第 1 章 介绍 过 用 于 科学 计算 的 交互 式 shell 工 具 IPython。IPython 的 
pylab 模 式 可 以 自动 导入 包括 NumPy 在 内 的 很 多 Python 科学 计算 库 ， 并 且 在 IPython 中 没有 必要 显 
式 调用 print 语 句 输出 变量 的 值 。 不 过 ， 本 书 配 套 的 源 代码 文件 中 均 为 使 用 了 import 和 print 
语句 的 标准 Python 代 码 。 











2.1 NumpPy 数组 对 象 
NumPy 中 的 ndaarray 是 一 个 多 维 数组 对 象 ， 该 对 象 由 两 部 分 组 成 : 


口 实际 的 数据 ; 
口 描述 这 些 数据 的 元 数据 。 


大 部 分 的 数组 操作 仅仅 修改 元 数据 部 分 ， 而 不 改变 底层 的 实际 数据 。 
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在 第 1 章 中, 我 们 已 经 知道 如 何 使 用 arange 函 数 创建 数组 。 实 际 上 ， 当 时 创建 的 数组 只 是 包 
含 一 组 数字 的 一 维 数组 ， 击 nqarray 文 持 更 高 的 维度 。 

NumPy 数 组 一 般 是 同 质 的 (但 有 一 种 特殊 的 数组 类 型 例外 ， 它 是 异 质 的 )， 即 数组 中 的 所 有 
元 素 类 型 必须 是 一 致 的 。 这 样 有 一 个 好 处 : 如 果 我 们 知道 数组 中 的 元 素 均 为 同一 类 型 ,该 数组 所 
需 的 存储 空间 就 很 容易 确定 下 来 。 

与 Python 中 一 样 ，NumPy 数 组 的 下 标 也 是 从 0 开始 的 。 数 组 元 素 的 数据 类 型 用 专门 的 对 象 表 
示 ， 而 这 些 对 象 我 们 将 在 本 童 详细 探讨 。 

我 们 再 次 用 arange 函 数 创建 数组 ， 并 获取 其 数据 类 型 : 























In: a = arange(5) 
In: a.dtype 
Out: dtype('int64') 


数组 a 的 数据 类 型 为 jnt64 ( 在 我 的 机 器 上 是 这 样 )， 当 然 如 果 你 使 用 32 位 的 Python， 得 到 的 
结果 可 能 是 int32。 不 论 是 哪 种 情形 ， 该 数组 的 数据 类 型 都 是 整数 ( 64 位 或 32 位 )。 除 了 数据 类 
型 ， 数 组 的 维度 也 是 重要 的 属性 。 

第 1 章 中 的 例子 演示 了 怎样 创建 一 个 向 量 ( 即 一 维 的 NumPy 数 组 ), 向量 在 数学 中 很 常用 , 但 
大 部 分 情况 下 ， 我 们 需要 更 高 维 的 对 象 。 先 来 确定 一 下 刚刚 所 创建 向 量 的 维度 : 






































In [4]: a 

Out[L4ls arrav([lO, 2 3; WI) 
In: a.shape 

Outs ‘(SY) 


正如 你 所 看 到 的 , 这 是 一 个 包含 5 个 元 素 的 向 量 , 取 值 分 别 为 0~4 的 整数 。 数 组 的 shape 属 性 
返回 一 个 元 组 (tuple )， 元 组 中 的 元 素 即 为 NumPy 数 组 每 一 个 维度 上 的 大 小 。 上 面 例子 中 的 数组 
是 一 维 的 ， 因 此 元 组 中 只 有 一 个 元 素 。 




















2.2 ”动手 实践 : 创建 多 维 数组 
既然 我 们 已 经 知道 如 何 创建 向 量 ， 现 在 可 以 试 着 创建 多 维 的 NumPy 数 组 ， 并 查看 其 维度 了 。 
(1) 创建 一 个 多 维 数组 。 
(2) 显示 该 数组 的 维度 。 











In: m = array([arange(2), arange(2)]) 
In: m 

Cat 

array([[0;, 1]; 
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In: m.shape 
Outs (2; 2) 


刚才 做 了 些 什么 














我 们 将 arange 函 数 创建 的 数组 作为 列表 元 素 ， 才 
创建 了 一 个 2x2 的 数组 ， 而 且 没 有 出 现任 何 报错 信息 。 


arzay 六 数 可 以 依据 给 定 的 对 象 生 成 数组 。 给 定 的 对 象 应 是 类 数组 ， 如 Python 中 的 列表 。 在 
上 面 的 例子 中 ， 我 们 传 给 array 函 数 的 对 象 是 一 个 NumPy 数 组 的 列表 。 像 这 样 的 类 数组 对 象 是 
array 函 数 的 唯一 必要 参数 ， 其 余 的 诸多 参数 均 为 有 默认 值 的 可 选 参 数 。 





这 个 列表 作为 参数 传 给 arravy 函 数 ， 从 而 


[起 





























突击 测验 : ndarray 对 象 维度 属性 的 存储 方式 


问题 1 ndqarray 对 象 的 维度 属性 是 以 下 列 哪 种 方式 存储 的 ? 
(1) 过 号 隔 开 的 字符 囊 

(2) Python 列 表 (list ) 

(3) Python 元 组 ( tuple ) 


勇敢 出 发 : 创建 3x3 的 多 维 数组 


现在 ,创建 一 个 3x3 的 多 维 数组 应 该 不 是 一 件 难 事 。 试 试看 ， 并 在 创建 多 维 数组 后 检查 其 
元 








2.2.1 选取 数组 元 素 





有 时 候 ， 我 们 需要 选取 数组 中 的 某 个 特定 元 素 。 首 先 还 是 创建 一 个 2x2 的 多 维 数组 : 


Ins 道 三 和 Prayl[ [li2]; [3;4]1]} 
Lt 
Quts 
array (Ll1i;, 21, 
[3, 4]]) 


在 创建 这 个 多 维 数组 时 , 我 们 给 array 函 数 传递 的 对 象 是 一 个 虞 套 的 列表 。 现在 来 依次 选取 
该 数组 中 的 元 素 。 记 住 ， 数 组 的 下 标 是 从 0 开始 的 。 




















In: al 
Outs I 
In: al[ 
Out: 2 


0,0] 
O31] 
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In: al 
Out: 3 
In: a[i 
Out: 4 

是 的 ,从 数组 中 选取 元 素 就 是 这 么 简单 。 对 于 数组 a， 只 需要 用 a [m,n] 选 取 各 数组 元 素 , 其 
中 m 和 mm 为 元素 下 标 ， 对 应 的 位 置 如 下 表 所 示 。 


耐克 


E30 


了 




















2.2.2 NumPy 数据 类 型 








Python 支持 的 数据 类 型 有 整 型 、 浮 点 型 以 及 复数 型 ， 但 这 些 类 型 不 足以 满足 科学 计算 的 需 
求 ， 因 此 NumPy 添 加 了 很 多 其 他 的 数据 类 型 。 在 实际 应 用 中 ， 我 们 需要 不 同 精度 的 数据 类 型 ， 
它们 占用 的 内 存 空间 也 是 不 同 的 。 在 NumPy 中 ， 大 部 分 数据 类 型 名 是 以 数字 结尾 的 ， 这 个 数字 
表示 其 在 内 存 中 占用 的 位 数 。 下 面 的 表格 ( 整理 自 NumPy 用 户 手 册 ) 列 出 了 NumPy 中 支持 的 数 
据 类 型 。 






























































































































































类 型 描 述 
bool 用 一 位 存储 的 布尔 类 型 ( 值 为 TRUE 或 FALSE ) 
inti 1 所 在 平台 决定 其 精度 的 整数 (一般 为 int32 或 int64 ) 
int8 整数 ， 范 围 为 -128 至 127 
int16 整数 ， 范 围 为 -32 768 至 32 767 
int32 整数 ， 范 围 为 -231 至 231 -1 
int64 整数 ， 范 围 为 -22 至 29 -1 
uint8 无 符号 整数 ， 范 围 为 0 至 255 
uint16 无 符号 整数 ， 范 围 为 0 至 65 535 
uint32 无 符号 整数 ， 范 围 为 0 至 222_1 
uint64 无 符号 整数 ， 范 围 为 0 至 264-_1 
float16 半 精 度 浮 点 数 ( 16 位 ) : 其 中 用 1 位 表示 正 负 号 ，5 位 表示 指数 ，10 位 表示 尾数 
float32 单 精 度 浮 点 数 (32 位 ) : 其 中 用 1 位 表示 正 负 号 ，8 位 表示 指数 ，23 位 表示 尾数 
float64 或 float 双 精度 浮 点 数 (64 位 ) : 其 中 用 1 位 表示 正 负 号 ，11 位 表示 指数 ，52 位 表示 尾数 
complex64 复数 ， 分 别 用 两 个 32 位 浮 点 数 表 示 实 部 和 虚 部 
complex128 或 complex 复数 ,分 别 用 两 个 64 位 浮 点 数 表 示 实 部 和 虚 部 














每 一 种 数据 类 型 均 有 对 应 的 类 型 转换 函数 : 
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In: float64(42) 


Out : 42.0 
Lr int8(42.0) 
Out: 42 


In: bool (42) 
Out: True 

In: bool(0) 
Out: False 

In: bool (42.0) 
Out: True 

In: float (True) 


OuUEts Ed 
In: float(False) 
Qut: ‘0.0 























在 NumPy 中 ， 许 多 函数 的 参数 中 可 以 指定 数据 类 型 ， 通 常 这 个 参数 是 可 选 的 : 


In: arange(7, dtype=uint16) 
Out: array([0, 1, 2, 3, 4, 5, 6], dtype=uint16) 


需要 注意 的 是 ， 复数 是 不 能 转换 为 整数 的 ， 这 将 触发 TypeError 错 误 : 


In [1] : int(42. 0+1. j) 








TypeErTror 
“ipython-input-1-5e824780381a> in “modu 
ss. > 1 int(42. 0. +1. j) 

TypeError: can't convert complex to int 











同样 ， 复 数 也 不 能 转换 为 浮 点 数 。 不 过 , 浮 点 数 却 可 以 转换 为 复数 , 例如 complex(1.0)。 注 意 ， 
有 j 的 部 分 为 复数 的 虚 部 。 





2.2.3 数据 类 型 对 象 

















数据 类 型 对 象 是 numpy. atype 类 的 实例 。 如 前 所 述 ，NumPy 数 组 是 有 数据 类 型 的 ， 更 确切 
地 说 , NumPy 数 组 中 的 每 一 个 元 素 均 为 相同 的 数据 类 型 。 数 据 类 型 对 象 可 以 给 出 单个 数组 元 素 在 
内 存 中 占用 的 字 节 数 ， 即 atype 类 的 itemsize 属 性 : 


In: a.dtype.itemsize 
Out: 8 








2.2.4 字符 编码 














NumPy 可 以 使 用 字符 编码 来 表示 数据 类 型 ， 这 是 为 了 兼容 NumPy 的 前 身 Numeric。 我 不 推荐 
使 用 字符 编码 ,但 有 时 会 用 到 , 因此 下 面 还 是 列 出 了 字符 编码 的 对 应 表 。 读 者 应 该 优先 使 用 atype 
对 象 来 表示 数据 类 型 ， 而 不 是 这 些 字 符 编 码 。 
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数据 类 型 字符 编码 

整数 i 
无 符号 整数 u 
单 精度 浮 点 数 上 
双 精度 浮 点 数 a 
布尔 值 b 
复数 D 
字符 申 s 
unicode 字 符 串 

void ( 空 ) V 


下 面 的 代码 创建 了 一 个 单 精度 浮 点 数 数组 : 


In: arange(7, dtype='f') 
Oats Barreavtl C7 sy 芝 s i 通 Ss 651. tvpe=float32) 


与 此 类 似 ， 还 可 以 创建 一 个 复数 数组 : 





In: arange(7, dtype='D') 
Out: array([ 0.+0.j, 1.+0.j, 2.+0.j, 3.+0.j, 4.+0.j, 5.+0.j, 6.+0.j]) 


2.2.5” 自 定义 数据 类 型 


我 们 有 很 多 种 自 定义 数据 类 型 的 方法 ， 以 浮 点 型 为 例 。 
口 可 以 使 用 Python 中 的 浮 点 数 类 型 : 


In: qtype(float) 
Out : dtype('float64') 


口 可 以 使 用 字符 编码 来 指定 单 精度 浮 点 数 类 型 . 


In: dtype('f') 
Out: dtype('float32') 


口 可 以 使 用 字符 编码 来 指定 双 精 度 浮 点 数 类 型 . 


In: dtype('d') 
Out: dtype('float64') 


口 还 可 以 将 两 个 字符 作为 参数 传 给 数据 类 型 的 构造 函数 。 此 时 ， 第 一 个 字符 表示 数据 类 型 ， 
第 二 个 字符 表示 该 类 型 在 内 存 中 占用 的 字 节 数 ( 2、4、8 分 别 代 表 精 度 为 16、32、64 位 的 
浮 点 数 ): 

















一 
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In: dtype('f8') 
Out : dtype('float64') 


完整 的 NumPy 数 据 类 型 列表 可 以 在 sctypeDict .keys () 中 找到 : 





In: sctypeDict.keys() 
Outs [0., 

2 

'int0'] 


2.2.6 ”dtype 类 的 属性 














dtype 类 有 很 多 有 用 的 属性 。 例 如 ， 我 们 可 以 获取 数据 类 型 的 字符 编码 : 


Tn: tt 二 dtype('Float64') 
Lr CClhiar 
Outs tq 


type 属 性 对 应 于 数组 元 素 的 数据 类 型 ; 


In: t.type 
Out: <type 'numpy.float64'> 


str 属 性 可 以 给 出 数据 类 型 的 字符 串 表 示 ， 该 字符 串 的 首 个 字符 表示 字 节 序 (endianness )， 
后 面 如 果 还 有 字符 的 话 , 将 是 一 个 字符 编码 , 接着 一 个 数字 表示 每 个 数组 元 素 存储 所 需 的 字 节 数 。 
这 里 ， 字 节 序 是 指 位 长 为 32 或 64 的 字 ( word ) 存储 的 顺序 ， 包 括 大 端 序 (big-endian ) 和 小 端 序 
( little-endian )。 大 端 序 是 将 最 高 位 字 节 存储 在 最 低 的 内 存 地 址 处 ， 用 > 表示 ; 与 之 相反 ， 小 端 序 
是 将 最 低位 字 节 存储 在 最 低 的 内 存 地 址 处 ， 用 < 表示 : 


Ins tStr 
Outs: ‘<£f8" 















































2.3 ”动手 实践 : 创建 自 定义 数据 类 型 


自 定义 数据 类 型 是 一 种 异 构 数据 类 型 ,可 以 当做 用 来 记录 电子 表格 或 数据 库 中 一 行 数据 的 结 
构 。 作 为 示例 ,我 们 将 创建 一 个 存储 商店 库存 信息 的 数据 类 型 。 其 中 ,我 们 用 一 个 长 度 为 40 个 字 
符 的 字符 串 来 记录 商品 名 称 , 用 一 个 32 位 的 整数 来 记录 商品 的 库存 数量 , 最 后 用 一 个 32 位 的 单 精 
度 浮 点 数 来 记录 商品 价格 。 下 面 是 具体 的 步骤 。 























(1) 创建 数据 类 型 . 

In: t = dtype([(,name', str_, 40), ('numitems', int32), ('price',float32)]) 
正 卉 全 玫 

Out: dtype([('name', '|S40'), ('numitems', '<i4'), ('price', '<f4')]) 
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(2) 查看 数据 类 型 ( 也 可 以 查看 某 一 字段 的 数据 类 型 ) : 





In: t['name'] 
Out: qtype('|S40') 


在 用 array 消 数 创建 数组 时 ， 如 果 没 有 在 参数 中 指定 数据 类 型 ,将 默认 为 浮 点 数 类 型 。 而 现 
在 ,我 们 想 要 创建 自 定义 数据 类 型 的 数组 ,就 必须 在 参数 中 指定 数据 类 型 ,否则 将 触发 TypeError 
错误 : 

In: itemz = array ([('Meaning of life DVD', 42, 3.14), ('Butter', 13, 2.72)], dtype=t) 


In: itemz[1] 
Out: ("Butter'; 13, 2.7200000286102295) 











刚才 做 了 些 什么 


我 们 创建 了 一 种 自 定 义 的 异 构 数 据 类 型 , 该 数据 类 型 包括 一 个 用 字符 串 记 录 的 名 字 、 一 个 用 
整数 记录 的 数字 以 及 一 个 用 浮 点 数 记录 的 价格 。 








2.4 一 维 数组 的 索引 和 切片 

一 维 数组 的 切片 操作 与 Python 列 表 的 切片 操作 很 相似 。 例 如 ， 我 们 可 以 用 下 标 3~7 来 选取 元 
素 3~6: 

In: a = arange(9) 

In: a[3:7] 

Out: array([3, 4, 5, 6]) 


也 可 以 用 下 标 0~7， 以 2 为 步 长 选取 元 素 : 


Tn [L732] 
Out: array([0, 2, 4, 6]) 


和 Python 中 一 样 ， 我 们 也 可 以 利用 负数 下 标 翻 转 数组 : 


In: a[::-1] 
Out: array([8,; 7, 6, 5 4,; 3; 2; 1; 0]) 


2.5 动手 实践 : 多 维 数组 的 切片 和 索引 


ngarray 文 持 在 多 维 数组 上 的 切片 操作 。 为 了 方便 起 见 ， 我 们 可 以 用 一 个 省 略 号 (... ) 来 
表示 遍历 剩 下 的 维度 。 


(1) 举例 来 说 ， 我 们 先 用 arange 函 数 创建 一 个 数组 并 改变 其 维度 ， 使 之 变 成 一 个 三 维 数组 : 





In: b = arange(24) .reshape(2,3,4) 
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In: b.shape 












































Qut: (2, 3, 4) 
下 
Dabs 
array{([[[ 0 1 2 3] 
[7 7] 
有 | 
L112 3 1， 于] 
[ci We A: | 
[20; 21; 22; 23]]]) 
多 维 数组 b 中 有 0~23 的 整数 ， 共 24 个 元 素 ， 是 一 个 2x3x4 的 三 维 数组 。 我 们 可 以 形象 地 把 它 
看 做 一 个 两 层 楼 建筑 ， 每 层 楼 有 12 个 房间 ， 并 排列 成 3 行 4 列 。 或 者 ， 我 们 也 可 以 将 其 看 成 是 电子 
表格 中 工作 表 ( sheet )\ 行 和 列 的 关系 。 你 可 能 已 经 狂 到 ,reshape 孙 数 的 作用 是 改变 数组 的 “ 形 








状 ” ， 也 充 
如 果 指 定 











是 改变 数组 的 维度 ， 其 参数 为 一 个 正 整 数 元 组 ， 分 别 指定 数组 在 每 个 维度 上 的 大 小 。 
的 维度 和 数组 的 元 素数 目 不 相 吻合 ， 函 数 将 抛 出 异常。 


(2) 我 们 可 以 用 三 维 坐标 来 选 定 任意 一 个 房间 ， 即 楼 层 、 行 号 和 列 号 。 例 如 ， 选 定 第 1 层 楼 、 
第 1 行 、 第 1 列 的 房间 (也 可 以 说 是 第 0 层 楼 、 第 0 行 、 第 0 列 ， 这 只 是 习惯 问题 )， 可 以 这 样 表示 : 


Inm: "BLO,0.,0] 


Out, 








0 





(3) 如 果 我 们 不 关心 楼 层 ， 也 就 是 说 要 选取 所 有 楼 层 的 第 1 行 、 第 1 列 的 房间 , 那么 可 以 将 第 1 
个 下 标 用 英文 标点 的 冒号 :来 代替 : 


Irys. BLsy00] 
Out: array([ 0, 12]) 
This selects the first floor 
Iri:: BLO] 
Duts 
array([[ 0, 1, 2, 3] 
[ ,es 62 了] 
[87 97L0;LLI]1) 
我 们 还 可 以 这 样 写 ， 选 取 第 1 层 楼 的 所 有 房间 : 
In: bl[0, ] 
Dut 
array([[ 0, 1, 2, 3] 
[Ls 5; ‘6 7] 
LB; .90%LLLI) 
多 个 冒号 可 以 用 一 个 省 略 号 (... ) 来 代替 ， 因 此 上 面 的 代码 等 价 于 : 
Tie BlOs wm] 
Wuts 
array([[ 0, 1, 2, 3], 
[ Wy 5 6 7]; 
[8 ' 9; EO LL 
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进而 可 以 选取 第 1 层 楼 、 第 2 排 的 所 有 房间 : 


Tn Bl El 
Out: array([4, 5, 6, 7]) 


(4) 再 进一步 ， 我 们 可 以 在 上 面 的 数组 切片 中 间隔 地 选 定 元 素 : 


Ins 各 [二 |] 
Out: array([4, 6]) 


(5) 如 果 要 选取 所 有 楼 层 的 位 于 第 2 列 的 房间 ， 即 不 指定 楼 层 和 行 号 ， 用 如 下 代码 即 可 : 





























| 
Ca 
array.([[ 1; 57 9]; 
E13 L7721]1) 
类 似 地 ， 我 们 可 以 选取 所 有 位 于 第 2 行 的 房间 ， 而 不 指定 楼 层 和 列 号 : 
Tns. Glsstl 
Ch 
array([[ 4, 5, 6, 7], 
LL67 17, L819]]) 
如 果 要 选取 第 1 层 楼 的 所 有 位 于 第 2 列 的 房间 ， 在 对 应 的 两 个 维度 上 指定 即 可 : 
| 


Out: array([1, 5, 9]) 
(6) 如 果 要 选取 第 1 层 楼 的 最 后 一 列 的 所 有 房间 ， 使 用 如 下 代码 : 


in BLOr sel 
Qut: array(l 3,; 77 11]) 


如 果 要 反 向 选取 第 1 层 楼 的 最 后 一 列 的 所 有 房间 ， 使 用 如 下 代码 : 


工科 下 [= =] 
Outs array (ll1l; 7y 3]) 


在 该 数组 切片 中 间隔 地 选 定 元 素 : 


Tn: bl0O,::2,=1] 
Out: array([ 3, 11]) 


如 果 在 多 维 数组 中 执行 翻转 一 维 数组 的 命令 , 将 在 最 前 面 的 维度 上 翻转 元 素 的 顺序 , 在 我 们 
的 例子 中 将 把 第 1 层 楼 和 第 2 层 楼 的 房间 交换 : 








In: bl[l::-1] 

Out’; 

Avray( EL2 L390] 
E607. L890]; 
L207.21.2275.23]; 
EE Os LE, 2 3; 
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La Sy 65 ly 
[B83 971001L1 1Y) 
刚才 做 了 些 什么 


我 们 用 各 种 方法 对 一 个 NumPy 多 维 数组 进 和 


2.6 动手 实践 : 改变 数组 的 维度 


我 们 已 经 学 习 了 怎样 使 用 reshape 郴 


了 了 切片 操作 。 





数 ， 现 在 来 学 习 一 下 怎样 将 数组 展 平 。 





(1) ravel 我 们 可 以 用 ravel1 函 数 完成 展 平 的 操作 : 














i 
Dats 
六 人 
[ 5 6 71,; 
[ 8; 9 L105 112); 
[EL2, 13. dS 
Lie6yL7 yeyL9)s 
L207;21;.22723]11) 
In: b.ravel() 
Outs 
array(l 0 Ty 2 3 4 By 6 7 .8 9 10 11; TL2, 3; 4, I5; ‘16; 
,By "9 ZO ZL 22 , D3]Y 
(2) flatten 这 个 函数 恰 如 其 名 ，f1latten 就 是 展 平 的 意思 ， 与 ravel 函 数 的 功能 相同 。 








不 过 , flatten 函 数 会 请 求 分 配 内 存 来 保存 结果 , 而 ravel 了 水 数 只 是 返回 数组 的 一 个 视图 ( view ): 


In: b.flatten() 
Out: 
0 2 3 L496; 
17; 18, 19, 20; 21; 22; 231) 
(3) 用 元 组 设置 维度 ”除了 可 以 使 用 reshape 函 数 ， 我 们 也 可 以 直接 用 一 个 正 整数 元 组 来 设 


置 数组 的 维度 ， 如 下 所 示 : 


Ls 





b.shape (6,4) 


A 


二 
正如 你 所 看 到 的 ， 
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heruihong 专 享 


这 样 的 做 法 将 直接 改变 所 操作 的 数组 , 现在 数组 b 成 了 一 个 6x4 的 多 维 数 组 。 
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(4) transpose 在 线性 代数 中 , 转 置 矩 阵 是 很 常见 的 操作 。 对 于 多 维 数组 , 我 们 也 可 以 这 样 做 : 


In: b.transpose() 





Out; 

array([[ 0, 4, 8, 12, 16, 20], 
E hy Sy 9%,3s 下 7 2Ll; 
[ 2, 6,10, 14, 1L8; 22]; 
[ -33 7alEl, 3 


(5) resize resize 和 reshape 国 数 的 功能 一 样 ， 但 resize 会 直接 修改 所 操作 的 数组 


In: b.resize( (2,12)) 

In: 攻 

Ca 

arzavit tl. Qs TL Zi 3 "dys: Br 6 7 Ba G7 TL0> TL: 
[12, 13, 14;,15,16;17;18.,19;:20;21, 22; 23]1) 





刚才 做 了 些 什么 


我 们 用 ravel、flatten.、 reshape 和 resize 涵 数 对 NumPy 数 组 的 维度 进行 了 修改 。 


2.7 ”数组 的 组 合 


NumPy 数 组 有 水 平 组 合 、 垂 直 组 合 和 深度 组 合 等 多 种 组 合 方 式 ， 我 们 将 使 用 vstack 、 
dstack、hstack、column_stack、row_stack 以 及 concatenate 清 数 来 完成 数组 的 组 合 。 





2.8 动手 实践 : 组 合 数组 
首先 ， 我 们 来 创建 一 些 数组 : 


In: a = arange(9) .reshape(3,3) 
Tm 
Out 
rayv{[[ 收 ;二 涩 | 
[3;、 生 ;> , 坊 ] 
L672 8])) 
和 
In: b 
Wie 
array([[ 0, 2, 4], 
[ 6, 8, 10] 
[12, T4161]) 


(1) 水 平 组 合 ”我 们 先 从 水 平 组 合 开 始 练习 。 将 ndarray 对 象 构成 的 元 组 作为 参数 ， 传 给 
hstack 气 数 。 如 下 所 示 : 
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0 Lx 2 007 27 4); 
【3505 
6; 了 87 工 27 工 人 于 6]) 


我 们 也 可 以 用 concatenate 国 数 来 实现 同样 的 效果 ， 如 下 所 示 : 


In: concatenate((a, b), axis=1) 
Outs 

array([[ 0, 1, 2, 0, 2, 4], 

bE Br My 5 6 Gr 

[ 6, 7, 8,12,14,16]]) 

















hstack 
或 者 

concatenate 

axis=1 

















(2) 垂直 组 合 ”垂直 组 合同 样 需要 构造 一 个 元 组 作为 参数 ， 只 不 过 这 次 的 函数 变 成 了 
vstack。 如 下 所 示 : 





In: vstack((a, b)) 
Outs 
array([ 


x 


7/ 


[ ] 
[ ] 
[ ] ， 
[ ] ， 
[ ] 
[ ] 


] ) 





同样 ， 我 们 将 concatenate 函 数 的 axis 人 参数 设置 为 0 即 可 实现 同样 的 效果 。 这 也 是 axis 参 
数 的 默认 值 : 
In: concatenatel((a, b), axis = 0) 


Dubs 
array([ 





[ 
[ 
[ 
[ 
[ 
[ 













vstack 

或 者 
concatenate 
axis=0 


















(3) 深度 组 合 ”将 相同 的 元 组 作为 参数 传 给 dstack 哺 数 ， 即 可 完成 数组 的 深度 组 合 。 所 谓 
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深度 组 合 ， 就 是 将 一 系列 数组 沿 着 纵 轴 ( 深度 





) 方向 进行 层 和 到 组合 人 有 若干 张 二 维 平 


面 内 的 图 像 点 阵 数据 , 我 们 可 以 将 这 些 图 像 数 据 治 纵 轴 方 向 层 受 在 一 起 , 这 就 形象 地 解释 了 什么 








是 深度 组 合 。 








In: dstack((a, b)) 
Cts 
array([[[0, 0], 
yr 
-i 
ES 6: 
4, 8], 
5,10]], 
LG 人 2 
7,14], 
8,16]]]) 
(4) 列 组 合 ”column_stack 上 因数 对 于 一 维 数组 将 按 列 方向 进 ， 如 下 所 示 : 
In: oned = arange(2) 
In: oned 
Out: array([0, 1]) 


In: twice oned = 2 * oned 
In: twice oned 
Out array (LO; 
In: column_ stack( (oned, twice_oned)) 


WU 
array([[0， 
[1; 


0 


] 


2] 
而 对 于 二 维 数 组 ，column_stack 与 hstack 的 效果 是 相同 的 : 


] ) 


2]) 


In: column_ stack((a, b)) 


In: column_ stack((a, b) 





1, 
4, 
7， 


hat 
array([[ 0, 
0 
6, 
Wak 
array([[ True, 
True, 
True, 


2, 0, 2, 
Ss © 8 
8,12,14 


True, True, 
True, True, 





True, True, 











b)) 


m 


m 





站 


ruel], 
ruel], 
rrue]], dtype=bool) 


是 的 ， 你 猜 对 了 ! 我 们 可 以 用 == 运 算 符 来 比较 两 个 NumPy 数 组 ， 是 不 是 很 简洁 ? 


(5) 行 组 合 “” 当然 ，NumPy 中 





也 有 按 行 方向 进行 组 合 的 函数 ， 它 就 是 zow_stack。 对 于 两 


个 一 维 数组 ， 将 直接 层 苹 起 来 组 合成 一 个 二 维 数组 。 


In: row_stack( (oned, twice_ oned)) 


Out; 
array([[0， 
[0， 


1 


] 


2] 
对 于 二 维 数 组 ，row_stack 与 vstack 的 效果 是 相同 的 : 


] ) 
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In: row_stack((a, b)) 








Quts 
array([[ 0, 1, 2], 
3, 4, 5], 
G6» Ti, Bs 
0, 2; 4]， 
6, 8,10], 
12,14,16]]) 
In: row_stack((a,b)) == vstack((a, b)) 
Duts 
array([[ True， True, Truel], 
True, True, Truel], 
True, True, Truel], 
True, True, Truel], 
True, True, Truel], 
True, True, True]], dtype=bool) 
刚才 做 了 些 什么 


我 们 按照 水 平 、 垂 直 和 深度 等 方式 进行 了 组 合 数 组 的 操作 。 我 们 使 用 了 vstack、dstack、 


hstack、column_stack、row_stack 以 及 concatenate 国 数 。 


2.9 数组 的 分 割 


NumPy 数 组 可 以 进行 水 平 、 垂 直 或 深度 分 割 ， 相 关 的 函数 有 hsplit、vsplit、dsplit 和 
split。 我 们 可 以 将 数组 分 割 成 相同 大 小 的 子 数组 ， 也 可 以 指定 原 数组 中 需要 分 割 的 位 置 。 














2.10 动手 实践 : 分 割 数 组 
(1) 水 平分 割 ” 下 面 的 代码 将 把 数组 沿 着 水 平方 向 分 割 为 3 个 相同 大 小 的 子 数组 : 




















NY “总 
uts 
array([L[l0s Ly .21 
3, 4, 5], 
6, 7, 8]]) 
In: hsplit(a; 3) 
Outs 
[array ([[0], 
SS]'; 
6]])， 
array ([[1], 
4]， 
了 
array ([[2]， 
5]， 
8]])] 
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对 同样 的 数组 ， 调 用 split 函 数 并 在 参数 中 指定 参数 axis=1， 对 比 一 下 结 


In: split(a, 3, axis=1) 
Wak 
[array ([ 





array (I[ 


array (I[ 


OUUDOD 和 PAWDO 











(2) 垂直 分 割 ”vsplit 函 数 将 把 数组 沿 着 垂直 方向 分 制 : 


In: vsplit(a, 3) 
Outs [array(L[0;, 1 2]]), array([l[3; :4; 5]]), array([LL6; 7 8 


同样 ， 调 用 split 函 数 并 在 参数 中 指定 参数 axis=0， 也 可 以 得 到 同样 的 结 





In;: Split(a, 3; axis=0) 

Out: [array([[0, 1, 2]]), array ([[3, 4, 5]]), array([[6, 7, 8]])] 

(3) 深度 分 割 ” 不 出 所 料 ，dsplit 函 数 将 按 深度 方向 分 割 数组 。 我 们 先 创建 一 个 三 维 数组 : 
In: C = arange(27) .reshape(3, 3, 3) 
I 总 
array (lL Oy Ty 2 
3 x Ss 
© 7. :Bs 
LE :90 LL]: 
12,13,14]; 
T5760 L731] 
L819 20] 7 
2 元 22523] 5 
24,25.;26]]1 
Ln ‘deplit(G 3) 

hat 
[array([ 
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泪 
[We 
地 





array([ 2] ， 














刚才 做 了 些 什么 


我 们 用 hsplit、vsplit、dqsplit 和 split 函 数 进行 了 分 割 数 组 的 操作 。 


2.11 





数组 的 属性 


除了 shape 和 atype 属 性 以 外 ，nqarray 对 象 还 有 很 多 其 他 的 属性 ， 在 下 面 一 一 列 出 
口 ndim 属 性 ， 给 出 数组 的 维 数 ， 或 数组 轴 的 个 数 : 








habs 

arrayv(t[ [Oy Ty 2 Bd Br 63 7 Br 9 ‘LOLL]; 
[12,13,14,15,16,17,18,19,20,21,22,23]]) 

In: b.ndim 

Out: 2 


size 属 性 ， 给 出 数组 元 素 的 总 个 数 ， 如 下 所 示 : 








In: b.size 
Out: 24 


itemsize 属 性 ， 给 出 数组 中 的 元 素 在 内 存 中 所 占 的 字 节 数 : 


In: b.itemsize 
Date 8 





口 如 果 你 想 知道 整个 数组 所 占 的 存储 空间 ， 可 以 用 nbytes 属 性 来 查看 。 这 





就 是 itemsize 和 size 属 性 值 的 乘积 








In: b.nbytes 


Out: 192 
In: b.size * b.itemsize 
Out: 192 
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这 个 属性 的 值 其 实 
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口 Tf 属性 的 效果 和 transpose 限 数 一 样 ， 如 下 所 示 : 


In: b.resize(6,4) 








Ini; 到 
| 
arravytll 0 Lr Zn 3 
4,.'5, 6 71; 
8 910 TE]; 
于 人 13. L4151; 
Lorl7r L890] 
20721;22723]]) 
Eo A 
Out: 
array (LL 0 4 8, 12,16; 20]; 
下 去- B95. LorLs ZI) 
2 610 L418 221]; 
二 二 “人 下 二] 





口 对 于 一 维 数 组 ， 其 z 属 性 就 是 原 数 组 : 





In: b.ndim 

Out: 1 

a 区 

Quts array{([l0; 1, 2 本 #4]) 


口 在 NumPy 中 ,复数 的 虚 部 是 用 j 表 示 的 。 例 如 ,我们 可 以 创建 一 个 由 复数 构成 的 数组 : 


Ts = array([1.j + 1, 2.j + 3]) 


B 
i 
Out: array([ 1.+1.j, 3.+2.j]) 


口 real 属 性 ,给 出 复数 数组 的 实 部 。 如 果 数 组 中 只 包含 实数 元 素 ， 则 其 real 属 性 将 输出 原 
数组 : 














In: b.real 
Out: array(l Toe, 3.1) 


口 imag 属 性 ， 给 出 复数 数组 的 虚 部 : 


In: b.imag 
Out: arravt(tl TL. 2.]) 


口 如 果 数 组 中 包含 复数 元 素 ， 则 其 数据 类 型 自动 变 为 复数 型 : 


In: b.dtype 

Out: dtype('complex128') 
In: b.dtype.str 

Out: '<c16' 


口 fl1at 属 性 将 返回 一 个 numpy .flatiter 对 象 , 这 是 获得 flatiter 对 象 的 唯一 方式 一 一 我 
们 无 法 访问 flatiter 的 构造 函数 。 这 个 所 谓 的 “扁平 迭代 器 ”可 以 让 我 们 像 遍 历 一 维 数 
组 一 样 去 遍历 任意 的 多 维 数组 ， 如 下 所 示 : 
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In: b = arange(4) .reshape(2,2) 


iis. 改 

Quts 

array (Ll0; 1 
[2;- 311 

In: f = b.flat 

于 总 二 


Out: <numpy.flatiter object at 0x103013e00> 
In: for item in f: print item 


我 们 还 可 以 用 flatiter 对 象 直接 获取 一 个 数组 元 素 : 


| 
Qt 2 


或 者 获取 多 个 元 素 : 


Tm: DatflatlL1l;3]] 
Out: array([1, 3]) 


flat 属 性 是 一 个 可 赋值 的 属性 。 对 flat 属 性 赋值 将 导致 整个 数组 的 元 素 都 被 覆盖 : 








加 











工科 六 blat :3 
Ti 
Quabs 
array([L7; Ty 
[7, 71]) 
or selected elements 
了 bflatlll.3]] = 1 
Tris BB 
at 
array([Ll7y 1]s 
[7 于] 




















[rea| [mag| 














2.12 ”动手 实践 : 数组 的 转换 
我 们 可 以 使 用 colist 函 数 将 NumpPy 数 组 转换 成 Python 列表 。 
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(1) 转换 成 列表 : 


Tn 反 
Out array([ 1.+1.j; 3.+2.]J]) 
In: b.tolist!() 


Outs [ (L141j);: (3+2j)] 
(2) astype 子 数 可 以 在 转换 数组 时 指定 数据 类 型 . 
于 


Out : array([ 1.+1.j, 3.+2.j]) 
In: b.astype (int) 
/usr/local/bin/ipython:1: ComplexWarning: Casting complex values to real discards the 
imaginary part 
#!/usr/bin/python 
Gut: arrayt[l, 3]) 


在 上 面 将 复数 转换 为 整数 的 过 程 中 ， 我 们 丢失 了 复数 的 虚 部 。astype 函 数 
也 可 以 接受 数据 类 型 为 字符 串 的 参数 。 


In: b.astype('complex') 


Out : array([ 1.+1.j, 3.+2.j]) 


这 一 次 我 们 使 用 了 正确 的 数据 类 型 ， 因 此 不 会 再 显示 任何 警告 信 ， 


后 


wm 


Ne 


刚才 做 了 些 什 么 
我 们 将 NumPy 数 组 转换 成 了 不 同 数据 类 型 的 Python 列 表 。 


2.13 ”本 章 小 结 


在 本 章 中 ， 我 们 学 习 了 很 多 NumPy 的 基础 知识 : 数据 类 型 和 NumPy 数 组 。 对 于 数组 而 言 ， 
有 很 多 属性 可 以 用 来 描述 数组 ， 数 据 类 型 就 是 其 中 之 一 。 在 NumPy 中 , 数组 的 数据 类 型 是 用 对 象 
来 完善 表示 的 。 


类 似 于 Python 列 表 , NumPy 数 组 也 可 以 方便 地 进行 切片 和 索引 操作 。 在 多 维 数组 上 , NumPy 
有 明显 的 优势 。 

涉及 改变 数组 维度 的 操作 有 很 多 种 一 一 组 合 、 调 整 、 设 置 维 度 和 分 割 等 。 在 这 一 章 中 , 对 很 
多 改变 数组 维度 的 实用 函数 进行 了 说 明 。 这 样 的 处 理 。 


在 学 习 完 基础 知识 后 ， 我 们 将 进入 到 第 3 章 来 学 习 NumPy 中 的 常用 函数 ， 包 括 基本 数学 函数 
和 统计 函数 等 。 
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在 本 章 中 ,我 们 将 学 习 NumPy 的 常用 函数 。 具 体 来 说 ， 我 们 将 以 分 析 历 
史 股 价 为 例 ， 介 绍 怎样 从 文件 中 载 入 数据 ， 以 及 怎样 使 用 NumPy 的 基本 数学 
和 统计 分 析 函 数 。 这 里 还 将 学 习 读 写 文件 的 方法 ,并 尝试 函数 式 编程 和 NumPy 
线性 代数 运算 。 





本 章 涵盖 以 下 内 容 : 
口 数组 相关 的 函数 ; 

口 从 文件 中 载 和 数据 | 

口 将 数组 写 人 文件 ; 

D 简单 的 数学 和 统计 分 析 函 数 。 





3.1 文件 读 写 


首先 , 我 们 来 学 习 使 用 NumPy 读 写 文件 。 通常 情况 下 ,数据 是 以 文件 形式 存储 的 。 学 会 读 写 
文件 是 深入 学 习 NumPy 的 基础 。 





3.2 ”动手 实践 : 读 写 文件 
作为 文件 读 写 示 例 ， 我 们 创建 一 个 单位 矩阵 并 将 其 存储 到 文件 中 ， 并 按照 如 下 步骤 完成 。 


(1) 单位 和 矩阵， 即 主 对 角 线 上 的 元 素 均 为 1， 其 余 元 素 均 为 0 的 正方 形 矩 阵 。 在 NumPy 中 可 以 
用 eye 函数 创建 一 个 这 样 的 二 维 数组 ， 我 们 只 需要 给 定 一 个 参数 ， 用 于 指定 矩阵 中 1 的 元 素 个 数 。 
例如 ， 创 建 2x2 的 数组 : 





i2 = np.eye(2) 
print i2 
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The output is: 
下 


(2) 使 用 savetxt 函 数 将 数据 存储 到 文件 中 ， 当 然 我 们 需要 指定 文件 名 以 及 要 保存 的 数组 。 
np.savetxt ("eye.txt", 1i2) 


上 面 的 代码 会 创建 一 个 eye.txt 文 件 ， 你 可 以 检查 文件 内 容 和 设想 的 是 否 一 致 。 这 个 示例 的 代 
码 (save.py ) 可 以 从 本 书 的 售后 支持 站 点 下 载 : http://www.packtpub.com/support。 


import numpy as np EE 


i2 = np.eye(2) 
print i2 
np.savetxt ("eye.txt", 1i2) 


刚才 做 了 些 什么 


读 写 文件 是 数据 分 析 的 一 项 基本 技能 。 我 们 用 savetxt 函 数 进 行 了 写 文件 的 操作 。 在 此 之 前 ， 
我 们 还 用 eye 函数 创建 了 一 个 单位 矩阵 。 





3.3 ”CSV 文件 


CSV ( Comma-Separated Value， 逗 号 分 隔 值 ) 格式 是 一 种 常见 的 文件 格式 。 通 常 ， 数据库 的 
转 存 文件 就 是 CSV 格 式 的 , 文件 中 的 各 个 字段 对 应 于 数据 库 表 中 的 列 。 众 所 周知 ， 电 子 表格 软件 
( 如 Microsoft Excel ) 可 以 处 理 CSV 文 件 。 








3.4 动手 实践 : 读 入 CSV 文件 


我 们 应 该 如 何 处 理 CSV 文 件 呢 ? 幸运 的 是 ，NumPy 中 的 1oadtxt 函 数 可 以 方便 地 读 取 CSV 
文件 ， 自 动 切 分 字段 ， 并 将 数据 载 和 人 NumPy 数 组 。 下面 ,我 们 以 载 入 全 果 公 司 的 历史 股价 数据 为 
例 展开 叙述 。 股 价 数据 存储 在 CSV 文 件 中 , 第 一 列 为 股票 代码 以 标识 股票 ( 苹果 公司 股票 代码 为 
AAPL )， 第 二 列 为 4d-mm-yyyy 格 式 的 日 期 ,第 三 列 为 空 ， 随 后 各 列 依 次 是 开盘 价 、 最 高 价 、 最 低 
价 和 收盘 价 ， 最 后 一 列 为 当日 的 成 交 量 。 下 面 为 一 行 数据 : 


AAPL,28-01-2011, ,344.17,344.4,333.53,336.1,21144800 


从 现在 开始 ,我 们 只 关注 股票 的 收盘 价 和 成 交 量 。 在 上 面 的 示例 数据 中 ， 收 盘 价 为 336 .1， 
成 交 量 为 21144800。 我 们 将 收盘 价 和 成 交 量 分 别 载 人 到 两 个 数组 中 ， 如 下 所 示 : 








c,v=np.loadtxt('data.csv', delimiter=',', usecols=(6,7), unpack=True) 


可 以 看 到 ， 数 据 存储 在 data.csv 文 件 中 ， 我 们 设置 分 隔 符 为 ，( 英文 标点 逗号 )， 因 为 我 们 要 
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处 理 一 个 CSV 文 件 。usecols 的 参数 为 一 个 元 组 ， 以 获取 第 7 字段 至 第 8 字段 的 数据 ， 也 就 是 股票 
的 收盘 价 和 成 交 量 数据 。unpack 参 数 设 置 为 True， 意 思 是 分 拆 存 储 不 同 列 的 数据 ， 即 分 别 将 收 
盘 价 和 成 交 量 的 数组 赋值 给 变量 c 和 v。 





























刚才 做 了 些 什么 


CSV 文 件 是 一 种 经 常用 于 数据 处 理 的 文件 格式 ,我 们 用 1oadtxt 函 数 读 取 了 一 个 包含 股价 数据 
的 CSV 文 件 , 用 aelimiter 参 数 指定 了 文件 中 的 分 隔 符 为 英文 逗号 , 用 usecols 中 的 参数 指定 了 我 
们 感 兴趣 的 数据 列 ， 并 将 unpack 人 参数 设置 为 rrue 使 得 不 同 列 的 数据 分 开 存 储 ， 以 便 随 后 使 用 。 


3.5 成 交 量 加 权 平 均 价 格 〈“VWAP ) 


VWAP(Volume-Weighted Average Price, 成 交 量 加 权 平 均 价格 ) 是 一 个 非常 重要 的 经 济 学 量 ， 
它 代 表 着 金融 资产 的 “平均 ”价格 。 某 个 价格 的 成 交 量 越 高 ， 该 价格 所 占 的 权重 就 越 大 。VWAP 
就 是 以 成 交 量 为 权重 计算 出 来 的 加 权 平 均值 ， 常 用 于 算法 交易 。 























一 ， ri » BS Apr 和 pw Vv 类 
3.6 ”动手 实践 : 计算 成 交 量 加 权 平 均 价格 
我 们 将 按 如 下 步骤 计算 。 
(1) 将 数据 读 入 数组 。 
(2) 计算 VWAP。 
import numpy as np 
CcC,v=np.loadtxt('data.csv', delimiter=',', usecols=(6,7), unpack=True) 
vwap = np.average(c, weights=v) 
print "VWAP =", vwap 


The output is 
VWAP = 350.589549353 


刚才 做 了 些 什 么 


这 很 容易 ， 不 是 吗 ? 我 们 仪 仅 调 用 了 average 函 数 ， 并 将 v 作 为 权重 参数 使 用 ， 就 完成 了 
VWAP 的 计算 。 此 外 ，NumPy 中 也 有 计算 算术 平均 值 的 函数 。 





3.6.1 算术 平均 值 函数 


NumPy 中 的 mean 函 数 很 友好 , 一 点 儿 也 不 mean ( 该 词 有 “尖酸 刻薄 ”的 意思 )。 这 个 函数 可 
以 计算 数组 元 素 的 算术 平均 值 。 具 体 用 法 如 下 : 
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print "mean =", np.mean(c) 
mean = 351.037666667 


3.6.2 ”时 间 加 权 平 均 价格 


在 经 济 学 中 ，TWAP ( Time-Weighted Average Price ， 时 间 加 权 平 均 价 格 ) 是 另 一 种 “平均 ” 
价格 的 指标 。 既 然 我 们 已 经 计算 了 VWAP， 那 也 来 计算 一 下 TWAP 吧 。 其 实 TWAP 只 是 一 个 变种 
而 已 ， 基 本 的 思想 就 是 最 近 的 价格 重要 性 大 一 些 ， 所 以 我 们 应 该 对 近期 的 价格 给 以 较 高 的 权重 。 
最 简单 的 方法 就 是 用 arange 函 数 创建 一 个 从 0 开始 依次 增长 的 自然 数 序 列 , 自然 数 的 个 数 即 为 收 
盘 价 的 个 数 。 当 然 ， 这 并 不 一 定 是 正确 的 计算 TWAP 的 方式 。 事 实 上 ， 本 书 中 关于 股价 分 析 的 大 
部 分 示例 都 仅仅 是 为 了 说 明 问题 。 计 算 TWAP 的 代码 如 下 。 






































出 | 














t = mnp.arange(1len(c)) 
print "twap =", np.average(c, weights=t) 


程序 将 输出 如 下 结 
twap = 352.428321839 


在 这 个 例子 中 ，TWAP 的 值 甚至 比 算术 平均 值 还 要 高 。 





突击 测验 : 计算 加 权 平 均值 





问题 1 以 下 哪个 函数 可 以 返回 数组 元 素 的 加 权 平 均值 ? 
(1) weightedq average 

(2) waverage 

(3) average 

(4) avg 


勇敢 出 发 : 计算 其 他 数据 的 平均 值 





请 尝试 对 开盘 价 做 相同 的 计算 ， 并 计算 成 交 量 和 其 他 各 种 价格 的 算术 平均 值 。 





3.7” 取 值 范围 


通常 ， 我 们 不 仅仅 想 知道 一 组 数据 的 平均 值 ， 还 希望 知道 数据 的 极 值 以 及 完整 的 取 值 范 
围 一 一 最 大 值 和 最 小 值 。 我 们 的 股价 示例 数据 中 已 经 包含 了 每 天 的 股价 范围 一 一 最 高 价 和 最 低 
价 。 但是, 我 们 还 需要 知道 最 高 价 的 最 大 值 以 及 最 低 价 的 最 小 值 。 不 然 , 我 们 怎样 才能 知道 自己 
的 股票 是 赚 了 还 是 赔 了 呢 ? 
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3.8 动手 实践 : 找到 最 大 值 和 最 小 值 
min 函 数 和 max 函 数 能 够 满足 需求 。 我 们 按 如 下 步 又 来 找 最 大 值 和 最 小 值 。 
(1) 首先 ， 需 要 再 次 读 和 人 数据， 将 每 日 最 高 价 和 最 低 价 的 数据 载 人 数组 ; 
h,l=np.loadtxt('data.csv',delimiter=',', usecols=(4,5), unpack=True) 
唯一 需要 修改 的 就 是 usecols 中 的 参数 ， 因 为 最 高 价 和 最 低 价 与 之 前 的 数据 在 不 同 的 列 中 。 
(2) 下 方 的 代码 即 可 获取 价格 区 间 : 











Print "highest =", np.max(h) 
print "lowest =", np.min(1) 
程序 将 返回 如 下 结果 : 





highest = 364.9 
lowest = 333.53 


现在 ,计算 区 间 中 点 就 很 容易 了 ， 留 给 读者 自己 尝试 练习 。 


(3) NumPy 中 有 一 个 ptp 函 数 可 以 计算 数组 的 取 值 范 围 。 该 函数 返回 的 是 数组 元 素 的 最 大 值 
和 最 小 值 之 间 的 差 值 。 也 就 是 说 ， 返 回 值 等 于 max(array) - min(array)。 调 用 ptp 孙 数 : 











print "Spread high price", np.ptp(h) 
print "Spread low price", np.ptp(1) 


我 们 将 看 到 如 下 结果 : 





Spread high price 24.86 
Spread low price 26.97 


刚才 做 了 些 什 么 


我 们 定义 了 股价 的 最 大 值 和 最 小 值 的 取 值 范围 。 最 大 值 是 在 每 日 最 高 价 数 据 上 使 用 max 函 数 
得 到 的 ， 而 最 低 价 是 在 每 日 最 低 价 数 据 上 使 用 min 函 数 得 到 的 。 我 们 还 用 ptp 函 数 计算 了 极 差 ， 
即 最 大 值 和 最 小 值 之 间 的 差 值 。 


import numpy as np 






































h,l=np.loadtxt('data.csv', delimiter=',', usecols=(4,5), unpack=True) 
print "highest =", np.max(h) 

print "lowest =", np.min(1) 

print (np.max(h) + np.min(1)) /2 


print "Spread high price", np.ptp(h) 
print "Spread low price", np.ptp(1) 
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3.9 统计 分 析 


股票 交易 者 对 于 收盘 价 的 预测 很 感 兴趣 。 常 识 告诉 我 们 , 这 个 价格 应 该 接近 于 某 种 均值 。 算 
数 平均 值 和 加 权 平 均值 都 是 在 数值 分 布 中 寻找 中 心 点 的 方法 。 然 而 ， 它 们 对 于 异常 值 ( outlier ) 
既 不 鲁 棒 也 不 敏感 。 举 例 来 说 ， 如 果 我 们 有 一 个 高 达 100 万 美元 的 收盘 价 ， 这 将 影响 到 我 们 的 计 
算 结果 。 





3.10 ”动手 实践 : 简单 统计 分 析 


我 们 可 以 用 一 些 闵 值 来 除去 异常 值 , 但 其 实 有 更 好 的 方法 , 那 就 是 中 位 数 。 将 各 个 变量 值 按 
大 小 顺序 排列 起 来 , 形成 一 个 数列 , 居于 数列 中 间 位 置 的 那个 数 即 为 中 位 数 。 例 如, 我 们 有 1、2、 
3、4、5 这 5 个 数值 ， 那 么 中 位 数 就 是 中 间 的 数字 3。 下 面 是 计算 中 位 数 的 步 又 。 


(1) 计算 收盘 价 的 中 位 数 。 创建 一 个 新 的 Python 脚 本 文件 , 命名 为 simplestats.py。 你 已 经 知道 
如 何 从 CSV 文 件 中 读 取 数据 到 数组 中 了 ， 因 此 只 需要 复制 一 行 代 码 并 确保 只 获取 收盘 价 数据 即 
可 ， 如 下 所 示 : 

















c=np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True) 


(2) 一 个 叫做 median 的 函数 将 帮助 我 们 找到 中 位 数 。 我 们 调用 它 并 立即 打印 出 结果 。 添加 下 
面 这 行 代码 : 

print "median =", np.median(c) 

这 上段 代码 的 输出 内 容 如 下 : 

median = 352.055 

(3) 既然 这 是 我 们 首次 使 用 medaian 函 数 ， 我 们 来 检查 一 下 结果 是 否 正 确 。 这 可 不 是 因为 我 
们 多 疑 ! 当然 ， 我 们 可 以 将 整个 数据 文件 浏览 一 过 并 人 工 找到 正确 的 答案 ， 但 那样 太 无 趣 了 。 
我 们 将 对 价格 数组 进行 排序 ， 并 输出 排序 后 居于 中 间 位 置 的 值 ， 这 也 就 是 模拟 了 寻找 中 位 数 的 
算法 。msort 函 数 可 以 帮 有 我 们 完成 第 一 步 。 我 们 将 调用 这 个 函数 ， 获 得 排序 后 的 数组 ， 并 输出 
结果 。 


























sorted close = np.msort(c) 
print "sorted =", sorted close 


这 段 代码 的 输出 内 容 如 下 : 


sorted = [ 336.1 338.61 339.32 342.62 342.88 343.44 344.32 345.03 346.5 
346.67 348.16 349.31 350.56 351.88 351.99 352.12 352.47 353.21 
354.54' 3552 355.30 355%786 358783 358416 35823 359.18" 359.,56, 
359,93 360 363 .13] 
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太 好 了 ， 代 码 生效 了 ! 现在 ， 我 们 来 获取 位 于 中 间 的 那个 数字 : 


N= len(c) 
print "middle =", sorted[(N - 1)/2] 


输出 如 下 : 
middle = 351.99 


(4) 喷 ， 这 个 值 和 meqaian 函 数 给 出 的 值 不 一 样 ， 这 是 怎么 回 事 ? 经 过 仔细 观察 我 们 发 现 ， 
median 冰 数 返 回 的 结果 甚至 根本 没有 在 我 们 的 数据 文件 里 出 现 过 。 这 就 更 奇怪 了 ! 在 给 NumPy 
团队 提交 bug 报 告 之 前 ， 我 们 先 来 看 下 文档 。 原 来 这 个 谜团 很 容易 解 开 。 原 因 就 在 于 我 们 的 简单 
算法 模拟 只 对 长 度 为 奇数 的 数组 奏效 。 对 于 长 度 为 偶数 的 数组 ,中 位 数 的 值 应 该 等 于 中 间 那 两 个 
数 的 平均 值 。 因 此 ， 输 入 如 下 代码 : 

















print "average middle =", (sorted[N /2] + sorted[(N- 1) / 2]) /2 
输出 结果 如 下 : 

average middle = 352.055 

成 功 了 ! 





(5) 另外 一 个 我 们 关心 的 统计 量 就 是 方差 。 方 差 能 够 体现 变量 变化 的 程度 。 在 我 们 的 例子 中 ， 
方差 还 可 以 告诉 我 们 投资 风险 的 大 小 。 那 些 股 价 变 动 过 于 剧烈 的 股票 一 定 会 给 持 有 者 制造 麻烦 。 
在 NumPy 中 ,计算 方差 只 需要 一 行 代码 ， 看 下 面 : 

print "variance =", np.varl(c) 

将 给 出 如 下 结 

variance = 50.1265178889 

(6) 既然 我 们 不 相信 NumPy 的 函数 , 那 就 再 次 根据 文档 中 方差 的 定义 来 复核 一 下 结果 。 注意 ， 
这 里 方差 的 定义 可 能 与 你 在 统计 学 的 书 中 看 到 的 不 一 致 ， 但 这 个 定义 在 统计 学 上 更 为 通用 。 





| 受 方差 是 指 各 个 数据 与 所 有 数据 算术 平均 数 的 离 差 平方 和 除 以 数据 个 数 所 得 
> 到 的 值 。 


一 些 书 里 面 告诉 我 们 ， 应 该 用 数据 个 数 减 1 去 除 离 差 平方 和 ?。 


print "Variance from definition =", np.mean((c - c.mean())**2) 




















GD 注意 样本 方差 和 总 体 方差 在 计算 上 的 区 别 。 总 体 方差 是 用 数据 个 数 去 除 离 差 平方 和 和 ， 而 样本 方差 则 是 用 样本 数据 
个 数 减 1 去 除 离 差 平方 和 ， 其 中 样本 数据 个 数 减 1 ( 即 太 1 ) 称 为 自由 度 。 之 所 以 有 这 样 的 差别 ， 是 为 了 保证 样本 
方差 是 一 个 无 偏 估计 量 。 一 一 译 者 注 
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输出 结果 如 下 : 
Variance from definition = 50.1265178889 


这 正 是 我 们 希望 得 到 的 结果 ! 





刚才 做 了 些 什么 

你 可 能 已 经 注意 到 了 一 些 新 东西 。 我 们 直接 在 数组 c 上 调用 了 mean 方 法 c .mean()， 是 的 ， 
没有 写 错 。ndaarray 对 象 有 mean 方 法 ， 这 将 给 你 带 来 便利 。 从 现在 开始 ， 记 住 这 种 用 法 是 正确 
无 误 的 。 示 例 代码 可 以 在 simplestats.py 中 找到 。 











import numpy as np 


c=np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True) 
print "median =", np.median(c) 

sorted = np.msort(c) 

print "sorted =", sorted 


N= lenl(c) 





print "middle =", sorted[(N - 1)/2] 

print "average middle =", (sorted[N /2] + sorted[(N- 1) / 2]) /2 
print "variance =", np.var(c) 

print "variance from definition =", np.mean((c - c.mean())**2) 


3.11 “股票 收益 率 


在 学 术 文 献 中 , 收盘 价 的 分 析 常 常 是 基于 股票 收益 率 和 对 数 收 益 率 的 。 简 单 收益 率 是 指 相 邻 
两 个 价格 之 间 的 变化 率 , 而 对 数 收 益 率 是 指 所 有 价格 取 对 数 后 两 两 之 间 的 差 值 。 我 们 在 高 中 学 习 
过 对 数 的 知识 ,“a” 的 对 数 减 去 “b” 的 对 数 就 等 于 “a 除 以 b” 的 对 数 。 因 此 ， 对 数 收益 率 也 可 
以 用 来 衡量 价格 的 变化 率 。 注 意 ， 由 于 收益 率 是 一 个 比值 ,例如 我 们 用 美元 除 以 美元 ( 也 可 以 是 
其 他 货币 单位 )， 因 此 它 是 无 量 纲 的 。 总 之 ,投资 者 最 感 兴趣 的 是 收益 率 的 方差 或 标准 差 ， 因 为 
这 代表 着 投资 风险 的 大 小 。 








3.12 ”动手 实践 : 分 析 股 票 收益 率 
按照 如 下 步 又 分 析 股 票 收益 率 。 


(1) 首先 , 我们 来 计算 简单 收益 率 。NumPy 中 的 aqiff 函 数 可 以 返回 一 个 由 相 邻 数组 元 素 的 差 
值 构成 的 数组 。 这 有 点 类 似 于 微 积分 中 的 微分 。 为 了 计算 收益 率 , 我 们 还 需要 用 差 值 除 以 前 一 天 
的 价格 。 不 过 这 里 要 注意 ，aiff 返 回 的 数组 比 收盘 价 数组 少 一 个 元 素 。 经 过 仔细 考虑 ， 我 们 使 
用 如 下 代码 : 
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returns = np.diff( arr ) / arr[ : -1] 

注意 ， 我 们 没有 用 收盘 价 数组 中 的 最 后 一 个 值 做 除数 。 接 下 来 ， 用 std 函 数 计算 标准 差 : 
print "Standard deviation =", np.stdl(returns) 

输出 结果 如 下 : 

Standard deviation = 0.0129221344368 


(2) 对 数 收益 率 计算 起 来 甚至 更 简单 一 些 。 我 们 先 用 1og 函 数 得 到 每 一 个 收盘 价 的 对 数 ， 再 
十 结果 使 用 ai ff 函数 即 可 。 


logreturns = np.diff( np.log(c) ) 


一 般 情 况 下 ， 我 们 应 检查 输入 数组 以 确保 其 不 含有 零 和 负数 。 和 否则 ， 将 得 到 一 个 错误 提示 。 
不 过 在 我 们 的 例子 中 ， 股 价 总 为 正 值 ， 所 以 可 以 将 检查 省 略 掉 。 


(3) 我 们 很 可 能 对 哪些 交易 日 的 收益 率 为 正 值 非常 感 兴趣 。 在 完成 了 前 面 的 步 又 之 后 ， 我 们 
只 需要 用 where 困 数 就 可 以 做 到 这 一 点 。where 辑 a 定 的 条 件 返 回 所 有 满足 条 件 的 数 
组 元 素 的 索引 值 。 输入 如 下 代码 : 


posretindices = np.where(returns > 0) 
print "Indices with positive returns", posretindices 


即 可 输出 该 数组 中 所 有 正 值 元 素 的 索引 。 


Indices with positive returns (array([ 0, 1, 4, 5, 6, 7, 9, 10, 11, 12, 16, 17, 18, 
L921 .22; 23»r .25 Qal)y) 


(4) 在 投资 学 中 , 波动 率 (volatility ) 是 对 价格 变动 的 一 种 度量 。 历史 波 动 率 可 以 根据 历史 价 
格 数据 计算 得 出 。 计 算 历 史 波 动 率 ( 如 年 波动 率 或 月 波动 率 ) 时 ,需要 用 到 对 数 收 益 率 。 年 波动 
率 等 于 对 数 收 益 率 的 标准 差 除 以 其 均值 ， 再 除 以 交易 日 倒数 的 平方 根 ， 通 常 交 易 日 取 252 天 。 我 
们 用 sta 和 mean 函 数 来 计算 ,代码 如 下 所 示 : 




















annual volatility = np.std(logreturns)/np.mean(logreturns) 
annual_ volatility = annual _ volatility / np.sqrt(1./252.) 
print annual_ volatility 


(5) 请 注意 sqrt 函 数 中 的 除法 运算 。 在 Python 中 , 整数 的 除法 和 浮 点 数 的 除法 运算 机 制 不 同 ， 
我 们 必须 使 用 浮 点 数 才能 得 到 正确 的 结果 。 与 计算 年 波动 率 的 方法 类 似 ,计算 月 波动 率 如 下 : 


print "Monthly volatility", annual_ volatility * np.sqrt(1./12.) 
刚才 做 了 些 什么 


我 们 用 计算 数组 相 邻 元 素 差 值 的 aiff 函 数 计算 了 简单 收益 率 ， 用 计算 数组 元 素 自 然 对 数 的 
1og 函 数 计算 了 对 数 收益 率 。 最 后 ,我们 计算 了 年 波动 率 和 月 波动 率 。 示 例 代码 见 return.py 文 件 。 


图 灵 社 区 会 员 heruihong 专 享 尊重 版 权 





3.14 ”动手 实践 : 分 析 日 期 数据 45 





import numpy as np 


c=np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True) 
returngs = np diff( G ) 7/ el 1: =1] 
print "Standard deviation =", np.stdl(returns) 


logreturns = np.diff( np.log(c) ) 


posretindices = np.where(returns > 0) 
print "Indices with positive returns", posretindices 





annual _ volatility = np.std(logreturns)/np.mean(logreturns) 
annual _ volatility = annual_ volatility / np.sqrt(1./252.) 
print "Annual volatility", annual volatility 


print "Monthly volatility"，annual_ volatility * np.sqrt(1./12.) 


3.13 日 期 分 析 


你 是 否 有 时 候 会 有 星期 一 焦虑 症 和 星期 五 狂躁 症 ?” 想 知道 股票 市 场 是 否 受 上 述 现 象 的 影 
响 ? 我 认为 这 值得 深入 研究 。 














3.14 动手 实践 : 分 析 日 期 数据 


首先 , 我 们 要 读 人 收盘 价 数据 。 随 后 , 根据 星期 几 来 切 分 收盘 价 数据 , 并 分 别 计算 平均 价格 。 
最 后 , 我 们 将 找 出 一 周 中 哪 一 天 的 平均 收盘 价 最 高 ， 哪 一 天 的 最 低 。 在 我 们 动手 之 前 ,， 有 一 个 善 
意 的 提醒 : 你 可 能 希望 利用 分 析 结 果 在 某 一 天 买 股票 或 卖 股 票 , 然而 我 们 这 里 的 数据 量 不 足以 做 
出 可 靠 的 决策 ， 请 先 咨 询 专 业 的 统计 分 析 师 再 做 决定 ! 


程序 员 不 喜欢 日 期 , 因为 处 理 日 期 总 是 很 烦琐 。NumPy 是 面向 浮 点 数 运算 的 , 因此 需要 对 日 
期 做 一 些 专门 的 处 理 。 请 自行 尝试 如 下 代码 ， 单 独 编写 脚本 文件 或 使 用 本 书 附带 的 代码 文件 : 

















dates, close=np.loadtxt('data.csv', delimiter=',', usecols=(1,6), unpack=True) 
执行 以 上 代码 后 会 得 到 一 个 错误 提示 : 

ValueError: invalid literal for float(): 28-01-2011 

按 如 下 步骤 处 理 日 期 。 


(1) 显然 ，NumPy 尝 试 把 日 期 转换 成 浮 点 数 。 我 们 需要 做 的 是 显 式 地 告诉 NumPy 怎 样 来 转换 
日 期 ， 而 这 需要 用 到 loaqtxt 函 数 中 的 一 个 特定 的 参数 。 这 个 参数 就 是 converters， 它 是 一 本 
数据 列 和 转换 函数 之 间 进 行 映射 的 字典 。 


为 此 ， 我 们 必须 写 出 转换 函数 : 
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星期 一 0 
星期 二 1 
星期 三 2 
星期 四 3 
星期 五 4 
星期 六 5 
星期 日 6 
ef datestr2num(s): 
return datetime.datetime.strptime 
(s, "%d-%m-%$Y") .date() .weekday () 


我 们 将 日 期 作为 字符 串 传 给 datestr2num 函 数 ， 如 “28-01-2011”。 这 个 字符 串 首先 会 按照 
定 的 形式 "$d-%sm-%Y" 转 换 成 一 个 datetime 对 象 ,补充 一 点 ,这 是 由 Python 标 准 库 提供 的 功能 ， 
与 NumPy 无 关 。 随 后 ，datetime 对 象 被 转换 为 aate 对 象 。 最 后 ， 调 用 weekday 方 法 返回 一 个 数 
字 。 如 同 你 在 注释 中 看 到 的 ， 这 个 数字 可 以 是 0 到 6 的 整数 ，0 代 表 星 期 一 ，6 代 表 星 期 天 。 当 然 ， 
具体 的 数字 并 不 重要 ， 只 是 用 作 标 识 。 


(2) 接 下 来 ， 我 们 将 日 期 转换 函数 挂 接 上 去 ， 这 样 就 可 以 读 和 人 数据 了 。 


鲁 间 着 间 间 间 大 站 











dates, close=np.loadtxt('data.csv', delimiter=',', usecols=(1,6), converters={1: 
datestr2num}, unpack=True) 

print "Dates =", dates 

输出 结果 如 下 : 

Dates. = | dQ i Ze 3 Ww DO, Le 2 0 0 0 
Es, | 

















如 你 所 见 ， 没 有 出 现 星 期 六 和 星期 天 。 股 票 交易 在 周末 是 休市 的 。 
(3) 我们 来 创建 一 个 包含 5 个 元 素 的 数组 , 分 别 代表 一 周 的 5 个 工作 日 。 数 组 元 素 将 初始 化 为 0。 





averages = np.zZeros(5) 


这 个 数组 将 用 于 保存 各 工作 日 的 平均 收盘 价 。 


(4) 我 们 已 经 知道 ，where 函 数 会 根据 指定 的 条 件 返 回 所 有 满足 条 件 的 数组 元 素 的 索引 值 。 
take 国 数 可 以 按照 这 些 索引 值 从 数组 中 取出 相应 的 元 素 。 我 们 将 用 take 函 数 来 获取 各 个 工作 日 
的 收盘 价 。 在 下 面 的 循环 体 中 ,我 们 将 遍历 0 到 4 的 日 期 标识 , 或 者 说 是 遍历 星期 一 到 星期 五 ， 然 
后 用 where 了 因数 得 到 各 工作 日 的 索引 值 并 存储 在 indaices 数 组 中 。 在 用 Fake 函数 获取 这 些 索引 值 
相应 的 元 素 值 。 最 后 ， 我 们 对 每 个 工作 日 计算 出 平均 值 存放 在 averages 数 组 中 。 代 码 如 下 : 























for i in range(5): 
indices = np.where(dates == i) 
prices = np.take(close, indices) 
avg = np.mean (prices) 
print "Day", i, "prices", prices, "Average", avg 
averages[i] = avg 
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输出 结果 如 下 : 


339.32 351.88 359.18 353.21 355.36]]1] Average 351..79 

345,03 355.2 359.9 338.6L1 349.31 355.76]] Average 350.635 

Day 2 prices 344.32 358.16 363.13 342.62 352.12 352.47]] Average 352.136666667 
Day 3 prices 343.44 354.54 358.3 342.88 359.56 346.67]] Average 350.898333333 
Day 4 prices [[ 336.1 346.5 356.85 350.56 348.16 360. 351.99]] Average 350.022857143 


(5) 如 果 你 愿意 ， 还 可 以 找 出 哪个 工作 日 的 平均 收盘 价 是 最 高 的 ， 哪 个 是 最 低 的 。 这 很 容易 
做 到 ， 用 max 和 min 函 数 即 可 ， 代 码 如 下 : 


Day 0 Prices 
Day 1 prices 





top = np.max(averages) 

print "Highest average", top 

print "Top day of the week", np.argmax(averages) 
bottom = np.minl(averages) 

print "Lowest average", bottom 

print "Bottom day of the week", np.argmin (averages) 


输出 结果 如 下 : 


Highest average 352.136666667 
Top day of the week 2 

Lowest average 350.022857143 
Bottom day of the week 4 





刚才 做 了 些 什么 


azrgmin 卫 数 返 回 的 是 averages 数 组 中 最 小 元 素 的 索引 值 ， 这 里 是 4， 也 就 是 星期 五 。 而 
argmax 国 数 返 回 的 是 averages 数 组 中 最 大 元 素 的 索引 值 ， 这 里 是 2， 也 就 是 星期 三 。 示 例 代 码 
见 weekdays.py 文 件 。 








import numpy as np 
from datetime import datetime 


星期 一 
星期 二 
星期 三 
星期 四 
星期 五 
星期 日 6 

def datestr2num(s): 

return datetime.strptime(s, "%d-%m-%Y") .date() .weekday () 


井 埋 井 砷 砷 砷 井 
wm 心 wP 口 


dates, close=np.loadtxt('data.csv', delimiter=',', usecols=(1,6), converters={1: 
datestr2num}, unpack=True) 
print "Dates =", dates 


averages = np.zeros(5) 


for i in range(5): 
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indices = np.where(dates == i) 

prices = np.take(close, indices) 

avg = np.mean (prices) 

print "Day", i, "prices", prices, "Average", avg 
averages[i] = avg 


top = np.max(averages) 
print "Highest average", top 
print "Top day of the week", np.argmax (averages) 


bottom = np.min(averages) 
print "Lowest average", bottom 
print "Bottom day of the week", np.argmin (averages) 


勇敢 出 发 : 计算 VWAP 和 TWAP 


这 一 节 的 内 容 很 有 趣 ! 在 示例 数据 中 ,你 的 苹果 股票 在 星期 五 是 最 便宜 的 一 天 而 星期 三 是 
最 值钱 的 一 天 。 先 不 管 我 们 的 数据 量 有 多 小 , 思考 一 下 是 否 有 更 合理 的 计算 平均 值 的 方式 ? 我 
们 是 不 是 应 该 考虑 成 交 量 呢 ? 如 果 计 算 时 间 加 权 的 平均 值 是 不 是 更 有 意义 呢 ? 快 尝试 一 下 吧 | 
请 计算 VWAP 和 TWAP， 你 可 以 在 本 章 的 开头 部 分 找到 一 些 相关 的 提示 。 





3.15 周 汇总 

在 之 前 的 “动手 实践 ”教程 中 , 我们 用 的 是 盘 后 数据 。 也 就 是 说 ,这些 数据 是 将 一 整 天 的 交 
易 数 据 汇 总 得 到 的 。 如 果 你 对 棉花 市 场 感 兴 趣 , 并且 有 数 十 年 的 数据 ,你 可 能 和 希望 对 数据 做 进 一 
步 的 汇总 和 压缩 。 开 始 动 手 吧 。 我 们 来 把 苹果 股票 数据 按 周 进行 汇总 。 

















3.16 ”动手 实践 : 汇总 数据 


我 们 将 要 汇总 整个 交易 周 中 从 周一 到 周 五 的 所 有 数据 。 数 据 覆 盖 的 时 间 段 内 有 一 个 玉 假 日 : 
2 月 21 日 是 总 统 纪念 日 。 这 天 是 星期 一 ， 美 国 股市 休市 ， 因 此 在 我 们 的 示例 数据 中 没有 这 一 天 的 
数据 记录 。 数 据 中 的 第 一 天 为 星期 五 ， 处 理 起 来 不 太 方 便 。 按 照 如 下 步骤 来 汇总 数据 。 

(1) 为 了 简单 起 见 ， 我 们 只 考虑 前 三 周 的 数据 ， 这 样 就 避免 了 节假日 造成 的 数据 缺失 。 你 可 
以 稍 后 尝试 对 其 进行 拓展 。 


close 
dates 


代码 基于 3.14 节 的 教程 。 


(2) 首先 我 们 来 找到 示例 数据 中 的 第 一 个 星期 一 。 回 忆 一 下 ， 在 Python 中 星期 一 对 应 的 编码 
是 0, 这 可 以 作为 where 函 数 的 条 件 。 接 着 ,我们 要 取出 数组 中 的 首 个 元 素 , 其 索引 值 为 0。 但 where 



































close[:16] 
dates[:16] 
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函数 返回 的 结果 是 一 个 多 维 数组 ， 因 此 要 用 ravel1 函 数 将 其 展 平 。 


# 找到 第 一 个 星期 一 


first monday = np.ravel (np.where(dates == 0)) [0] 
print "The first Monday index is", first monday 
输出 结果 如 下 : 





The first Monday index is 1 





(3) 下 面 要 做 的 是 找到 示例 数据 的 最 后 一 个 星期 五 ， 方 法 和 找 第 一 个 星期 一 类 似 。 星 期 五 相 





对 应 的 编码 是 4。 此 外 ,我们 用 -1 作为 索引 值 来 定位 数组 的 最 后 一 个 元 素 。 
# ”找到 最 后 一 个 星期 五 


last_friday = np.ravel (np.where(dates == 4))[-2] 
print "The last Friday index is", last_friday 


输出 结果 如 下 : 
The last Friday index is 15 
接 下 来 创建 一 个 数组 ， 用 于 存储 三 周 内 每 一 天 的 索引 值 。 


weeks_indices = np.arange (first monday, last_ friday + 1) 
print "Weeks indices initial", weeks_ indices 


(4) 按照 每 个 子 数组 5 个 元 素 ， 用 sp1lit 函 数 切 分 数组 : 


weeks_indices = np.split(weeks_ indices, 5) 
print "Weeks indices after split", weeks_indices 


输出 结果 如 下 : 














Weeks indices after split [array([1, 2, 3, 4, 5]), array([ 6, 7, 8, 9, 10]), array([11, 


下 2 .13 T4135]) 


(5) 在 NumPy 中 ， 数 组 的 维度 也 被 称 作 轴 。 现 在 我 们 来 熟悉 一 下 apply_along_axis 卫 数 。 
这 个 函数 会 调用 另外 一 个 由 我 们 给 出 的 函数 ， 作 用 于 每 一 个 数组 元 素 上 。 目 前 我 们 的 数组 中 有 3 


个 元 素 ， 分 别 对 应 于 示例 数据 中 的 3 个 星期 ， 元 素 中 的 索引 值 对 应 于 示例 数据 中 的 1 天 。 


apply_along_axis 时 提供 我 们 自 定义 的 函数 名 summarize， 并 指定 要 作用 的 轴 或 维度 的 编号 


(如 取 1 )、 目 标 数组 以 及 可 变数 量 的 summarize 国 数 的 参数 。 


在 调用 

















weeksummary = np.apply along_axis(summarize，1，weeks_indices,open，high，1Llow，close) 


print "Week summary", weeksummary 








(6) 编写 summarize 困 数 。 该 函数 将 为 每 一 周 的 数据 返回 一 个 元 组 ， 包 含 这 一 周 的 开盘 价 、 











最 高 价 、 最 低 价 和 收盘 价 ， 


def summarize(a，o，h，1，c) : 
monday_open = o[a[0]] 
week high = np.max( np.take(h, a) ) 
week_ low = np.min( np.take(l1, a) ) 
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friday_close = c[a[-1]] 


return("APPL", monday_open, week high, week_ low, friday_ close) 


注意 ,我 们 用 take 函 数 来 根据 索引 值 获取 数组 元 素 的 值 ， 并 用 max 和 min 子 数 轻松 计算 出 一 
周 的 最 高 股价 和 最 低 股 价 。 一 周 的 开盘 价 即 为 周一 的 开盘 价 , 而 一 周 的 收盘 价 即 为 周 五 的 收盘 价 。 
Week summary [['APPL' '335.8' '346.7' '334.3' '346.5'] 


['APPL' '347.89' '360.0' '347.64' '356.85'] 
[TAPPLE" "356.79' "364.9" "349.52” "350,.56"] 


(7) 使 用 NumPy 中 的 savetxt 了 函数， 将 数据 保存 至 文件 。 

np.savetxt ("weeksummary.csv", weeksummary, delimiter=",", fmt="%s") 

如 代码 中 所 示 , 我 们 指定 了 文件 名 、 需 要 保存 的 数组 名 、 分 隔 符 (在 这 个 例子 中 为 英文 标点 
逗号 ) 以 及 存储 浮 点 数 的 格式 。 


格式 字符 串 以 一 个 百 分 号 开始 。 接 下 来 是 一 个 可 选 的 标志 字符 : -表示 结果 左 对 齐 ，0 表 示 
左 端 补 0，+ 表 示 输 出 符号 ( 正 号 + 或 负 号 - )。 第 三 部 分 为 可 选 的 输出 宽度 参数 ， 表 示 输 出 的 最 小 
位 数 。 第 四 部 分 是 精度 格式 符 ， 以 "." 开 头 , 后 面 跟 一 个 表示 精度 的 整数 。 最 后 是 一 个 类 型 指定 字 
符 ， 在 我 们 的 例子 中 指定 为 字符 串 类 型 。 
















































































字符 编码 含义 

c 单个 字符 

a 或 i 十 进 制 有 符号 整数 

e 或 E 科学 记 数 法 表示 的 学 点 数 

£ 汉 点 数 

g 或 6 自动 在 、E 和 + 中 选择 合适 的 表示 法 
5 八进制 有 符号 整数 

字符 中 

u 十 进 制 无 符号 整数 

x 或 x 十 六 进 制 无 符号 整数 











用 你 喜欢 的 文本 编辑 器 打开 刚刚 生成 的 文件 ， 或 在 命令 行 中 输入 如 下 命令 : 


cat weeksummary.csv 
APPL,335.8,346.7,334.3,346.5 
APPL,347.89,360.0,347.64,356.85 
APPL,356.79,364.9,349.52,350.56 


刚才 做 了 些 什 么 


我 们 刚刚 完成 的 事情 在 其 他 编程 语言 中 几乎 是 无 法 完成 的 。 我 们 定义 了 一 个 函数 
summarize, 把 它 作 为 参数 传 给 了 apply_along_axis 也 数 ， 而 summarize 的 参数 也 通过 
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apply_along_axis 的 参数 列表 便捷 地 传递 了 过 去 。 示 例 代 码 见 weeksummary.py 文 件 。 


import numpy as np 





from datetime import datetime 
星期 一 0 
星期 二 1 
星期 三 2 
星期 四 3 
星期 五 4 
星期 六 5 
星期 日 6 





def datestr2num(s): 
return datetime.strptime(s, "%d-%m-%Y") .date() .weekday () 


dates, open, high, low, close=np.loadtxt('data.csv', delimiter=',', usecols=(1, 3, 4, 
5, 6), converters={1: datestr2num}, unpack=True) 

close = close[:16] 

dates = dates[:16] 


# get first Monday 
first monday = np.ravel (np.where(dates == 0)) [0] 
print "The first Monday index is", first monday 


# get last Friday 
last_friday = np.ravel (np.where(dates == 4))[-1] 
print "The last Friday index is", last_friday 


weeks_indices = np.arange (first monday, last friday + 1) 
print "Weeks indices initial", weeks_ indices 


weeks_indices = np.split(weeks_ indices, 3) 
print "Weeks indices after split", weeks_indices 


def summarize(a, o, h, 1, c): 
monday_open = o[a[0]] 
week high = np.max( np.take(h, a) ) 
week_ low = np.min( np.take(l1, a) ) 
friday_close = c[a[-1]] 


return("APPL", monday_open, week high, week low, friday_close) 


weeksummary = np.apply_along axis(summarize, 1, weeks_indices, open, high, low, close) 
print "Week summary", weeksummary 


np.savetxt ("weeksummary.csv", weeksummary, delimiter=",", fmt="%s") 


勇敢 出 发 : 


改进 代码 , 使 其 能 够 Sl 清 况 。 对 代码 进行 性 能 分 析 ， 考察 apply_along_ 
axis 函 数 的 使 用 能 带 来 多 少 速度 上 的 提升 。 
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3.17 ”真实 波动 幅度 均值 (ATR) 


AIR ( Average True Range， 真 实 波动 幅度 均值 ) 是 一 个 用 来 衡量 股价 波动 性 的 技术 指标 。 
ATR 的 计算 并 不 是 重点 ， 只 是 作为 演示 几 个 NumPy 函 数 的 例子 ， 包 括 maximum 函 数 。 














3.18 ”动手 实践 : 计算 真实 波动 幅度 均值 
按照 如 下 步骤 计算 真实 波动 幅度 均值 。 
(1) ATR 是 基于 N 个 交易 日 的 最 高 价 和 最 低 价 进 行 计算 的 ， 通 常 取 最 近 20 个 交易 日 。 





N= int(sys.argv[1]) 
h = hl-N:] 
1 = 1[-N:] 


(2) 我 们 还 需要 知道 前 一 个 交易 日 的 收盘 价 。 
previousclose = c[-N -1: -1] 
对 于 每 一 个 交易 日 ， 计 算 以 下 各 项 。 


口 np - 1 当日 股价 范围 ， 即 当日 最 高 价 和 最 低 价 之 差 。 
口 hp - previousclose 当日 最 高 价 和 前 一 个 交易 日 收盘 价 之 差 。 
口 previousclose - 1 前 一 个 交易 日 收盘 价 和 当日 最 低 价 之 差 。 


(3) max 函 数 返回 数组 中 的 最 大 值 。 基 于 上 面 计算 的 3 个 数值 ， 我 们 来 计算 所 谓 的 真实 波动 幅 
度 , 也 就 是 这 三 者 的 最 大 值 。 现 在 我 们 想 在 一 组 数组 之 间 按 照 元 素 挑选 最 大 值 一 一 也 就 是 在 所 有 
的 数组 中 第 一 个 元 素 的 最 大 值 、 第 二 个 元 素 的 最 大 值 等 。 为 此 , 需要 用 NumPy 中 的 maximum 函 数 ， 
而 不 是 max 函 数 。 




















truerange = np.maximum(h - 1, h - previousclose, previousclose - 1) 
(4) 创建 一 个 长 度 为 N 的 数组 atr， 并 初始 化 数组 元 素 为 0。 
atr = np.zeros (N) 


(5) 这 个 数组 的 首 个 元 素 就 是 Lruerange 数 组 元 素 的 平均 值 。 


((N-1)PATR+TR) 
N 
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atr[0] = np.mean(truerange) 


用 如 下 公式 计算 其 他 元 素 的 值 : 
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这 里 ，PATR 表 示 前 一 个 交易 日 的 ATR 值 ，TR 即 当日 的 真实 波动 幅度 。 


for i in range(l1l, N): 
atr[i] = (N - 1) * atr[i - 1] + truerange[i] 
atr[i] /= N 


刚才 做 了 些 什么 


我 们 生成 了 3 个 数组 , 分 别 表 示 3 种 范围 一 一 当日 股价 范围 , 当日 最 高 价 和 前 一 个 交易 日 收盘 
价 之 差 ， 以 及 前 一 个 交易 日 收盘 价 和 当日 最 低 价 之 差 。 这 告诉 我 们 股价 波动 的 范围 , 也 就 是 波动 
性 的 大 小 。ATR 的 算法 要 求 我 们 找 出 三 者 的 最 大 值 。 而 之 前 使 用 的 max 函 数 只 能 给 出 一 个 数组 内 
的 最 大 元 素 值 ， 并 非 这 里 所 需要 的 。 我们 要 在 一 组 数组 之 间 挑 选 每 一 个 元 素 位 置 上 的 最 大 值 , 也 
就 是 在 所 有 的 数组 中 第 一 个 元 素 的 最 大 值 、 第 二 个 元 素 的 最 大 值 等 。 在 这 一 节 的 “动手 实践 ” 教 
程 中 , 我 们 了 解 到 maximum 函 数 可 以 做 到 这 一 点 。 最终 ,我 们 根据 每 一 天 的 真实 波动 幅度 值 计算 

一 个 移动 平均 值 。 示 例 代码 见 atr.py 文 件 。 




















import numpy as np 
import sys 


h, 1, c¢c = np.loadtxt('data.csv', delimiter=',', usecols=(4, 5, 6), unpack=True) 
N = int(sys.argv[1]) 

h = h[-N:] 

1 = 1[-N:] 

print "len(h)", len(h), "len(1)", len(1) 


Berint "CLoOSe™, “€ 
previousclose = c[-N -1: -1] 


print "len(previousclose)", len(previousclose) 
print "Previous close", previousclose 
truerange = np.maximum(h - 1, h - previousclose, previousclose - 1) 


print "True range", truerange 
atr = np.zeros(N) 
atr[0] = np.mean (truerange) 
for i in range(l1l, N): 
atr[i] = (N - 1) * atr[i - 1] + truerange[i] 


atr[i] /= N 


print "ATR", atr 


在 随后 的 教程 中 ,我 们 将 学 习 更 好 的 计算 移动 平均 值 的 方法 。 
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勇敢 出 发 : 党 试 mninimum 函 数 





除了 maximum 马 数 ,NumPy 中 还 有 一 个 minimum 函 数 。 你 可 能 已 经 猜 到 了 这 个 函数 的 功能 。 
请 创建 一 小 段 脚 本 或 在 IPython 中 创建 一 个 会 话 ， 以 证 明 你 的 猜想 。 





3.19 简单 移动 平均 线 


简单 移动 平均 线 (simple moving average ) 通常 用 于 分 析 时 间 序 列 上 的 数据 。 为 了 计算 它 ， 
我 们 需要 定义 一 个 MX 个 周期 的 移动 窗口 ， 在 我 们 的 例子 中 即 N 个 交易 日 。 我 们 按照 时 间 序 列 滑动 
这 个 窗口 ， 并 计算 窗口 内 数据 的 均值 。 
































3.20 动手 实践 : 计算 简单 移动 平均 线 


移动 平均 线 只 需要 少量 的 循环 和 均值 函数 即 可 计算 得 出 ,但 使 用 NumPy 还 有 更 优 的 选 
择 convolve 国 数 。 简单 移动 平均 线 只 不 过 是 计算 与 等 权重 的 指示 函数 的 卷 积 ， 当 人 然 ， 也 可 
以 是 不 等 权重 的 。 




















& 卷 积 是 分 析 数 学 中 一 种 重要 的 运算 ,定义 为 一 个 函数 与 经 过 翻转 和 平移 的 另 
~ 一 个 函数 的 乘积 的 积分 。 


按照 如 下 步 又 计算 简单 移动 平均 线 。 

(1) 使 用 ones 函 数 创建 一 个 长 度 为 N 的 元 素 均 初 始 化 为 1 的 数组 ， 然 后 对 整个 数组 除 以 N， 即 
可 得 到 权重 。 如 下 所 示 : 

N= int(sys.argv[1]) 


weights = np.ones(N) /'N 
print "Weights", weights 


在 N= 5 时 ， 输 出 结果 如 下 : 
Weights. [ 0.2 0.2 0.2 .0.2 0.2] 


(2) 使 用 这 些 权 重 值 ， 调 用 convolve 国 数 : 











c= np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True) 
sma = np.convolve (weights, c) [N-1:-N+1] 


(3) 我 们 从 convolve 函 数 返 回 的 数组 中 ， 取 出 中 间 的 长 度 为 N 的 部 分 "。 下 面 的 代码 将 创建 
一 个 存储 时 间 值 的 数组 ， 并 使 用 Matplotlib 进 行 绘图 。 我 们 会 在 后 续 章 节 学 习 这 个 绘图 库 。 











Q@ 即 两 者 做 卷 积 运 算 时 完全 重 和 的 区 域 。 一 一 译 者 注 
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c = np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True) 
sma = np.convolve (weights, c) [N-1:-N+1] 
t = np.arange(N - 1, len(c)) 


plot(t, c[N-1:], lw=1.0) 
plot(t, sma, lw=2.0) 
Show() 


在 下 图 中 ， 相 对 较 平滑 的 粗 线 描绘 的 是 5 日 移动 平均 线 ， 而 锯齿 状 的 细 线 描绘 的 是 每 天 的 收 
盘 价 。 























刚才 做 了 些 什么 


我 们 计算 出 了 收盘 价 数据 的 简单 移动 平均 线 。 是 的 , 你 掌握 了 很 重要 的 知识 , 那 就 是 简单 移 
动 平均 线 可 以 用 信号 处 理 技术 求解 一 一 与 1/N 的 权重 进行 卷 积 运算 , N 为 移动 平均 窗口 的 大 小 。 我 
们 还 学 习 了 ones 函 数 的 用 法 ， 即 可 以 创建 元 素 均 为 1 的 数组 ， 以 及 convolve 函 数 ， 计 算 一 组 数 
据 与 指定 权重 的 卷 积 。 示 例 代码 见 sma.py 文 件 。 





import numpy as np 

import sys 

from matplotlib.pyplot import plot 
from matplotlib.pyplot import show 


N = int(sys.argv[1]) 


weights = np.ones(N) /'N 
print "Weights", weights 


c = np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True) 
sma = np.convolve (weights, c) [N-1:-N+1] 
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t = np.arange(N - 1, len(c)) 


plot(t, c[N-1:], lw=1.0) 
plot(t, sma, lw=2.0) 
Show() 


3.21 指数 移动 平均 线 


除了 简单 移动 平均 线 ， 指 数 移动 平均 线 ( exponential moving average ) 也 是 一 种 流行 的 技术 
指标 ,指数 移动 平均 线 使 用 的 权重 是 指数 衰减 的 ,对 历史 上 的 数据 点 赋予 的 权重 以 指数 速度 减 小 ， 
但 永远 不 会 到 达 0。 我 们 将 在 计算 权重 的 过 程 中 学 习 exp 和 1inspace 国 数 。 


3.22 ”动手 实践 : 计算 指数 移动 平均 线 
给 定 一 个 数组 ，exp 函 数 可 以 计算 出 每 个 数组 元 素 的 指数 。 例 如 ， 看 下 面 的 代码 : 


x = np.arange(5) 
print "Exp", np.exp (x) 


输出 结果 如 下 : 
Exp [ 1. 2.71828183 7.3890561 20.08553692 54.59815003] 


linspace 子 数 需 要 一 个 起 始 值 和 一 个 终止 值 参 数 ， 以 及 可 选 的 元 素 个 数 的 参数 ， 它 将 返回 
一 个 元 素 值 在 指定 的 范围 内 均匀 分 布 的 数组 。 如 下 所 示 : 





print "Linspace", np.linspace(-1, 0, 5) 
输出 结果 如 下 : 

Linspace [-1. -0.75 -0.5 -0.25 0.1 

下 面 我 们 来 对 示例 数据 计算 指数 移动 平均 线 。 

(1) 还 是 回 到 权重 的 计算 一 一 这 次 使 用 exp 和 1inspace 国 数 。 





N = int(sys.argv[1]) 
weights = np.exp(np.linspace(-1. ，0 N) ) 


(2) 对 权重 值 做 归 一 化 处 理 。 我 们 将 用 到 ndqarray 对 象 的 sum 方 法 。 


weights /= weights.sum() 
print "Weights", weights 


在 N= 5 时 ,我 们 得 到 的 权重 值 如 下 : 


Weights [ 0.11405072 0.14644403 0.18803785 0.24144538 0.31002201] 
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(3) 接 下 来 就 很 容易 了 , 我 们 只 需要 使 用 在 简单 移动 平均 线 一 节 中 学 习 到 的 convolve 函 数 即 
可 。 同 样 ， 我 们 还 是 将 结果 绘制 出 来 。 


c = np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True) 
ema = np.convolve (weights, c) [N-1:-N+1] 

t = np.arange(N - 1, len(c)) 

plot(t, cec[N-1:], lw=1.0) 












































plot(t, ema, lw=2.0) 
Show() 
我 们 再 次 得 到 了 曼妙 的 折线 图 ,与 之 前 一 样 ,相对 比较 平滑 的 粗 线 描绘 的 是 指数 移动 平均 线 ， 
而 锯齿 状 的 细 线 描绘 的 是 每 天 的 收盘 价 。 
365 ; 
360| 
355| 
350 
345| 
340 上 | 
3350 5 10 15 20 35 30 
刚才 做 了 些 什么 


我 们 对 收盘 价 数据 计算 了 指数 移动 平均 线 。 首 先 ， 我 们 使 用 sxp 和 1inspace 函 数 计算 出 指 
数 衰减 的 权重 值 。1inspace 函 数 返回 的 是 一 个 元 素 值 均匀 分 布 的 数组 ， 随 后 我 们 计算 出 它们 的 
指数 。 为 了 将 这 些 权重 值 归 一 化 ， 我 们 调用 了 ndarray 对 象 的 sum 方 法 。 最 后 ， 我 们 再 次 应 用 了 
在 前 面 简单 移动 平均 线 一 节 中 学 习 到 的 convolve 浮 数 ， 最 终 计 算出 指数 移动 平均 线 。 示 例 代 码 
见 ema.py 文 件 。 








import numpy as np 

import sys 

from matplotlib.pyplot import plot 
from matplotlib.pyplot import show 


x = np.arange(5) 
print "Exp", np.exp(x) 
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print "Linspace", np.linspace(-1, 0, 5) 


N = int(sys.argv[1]) 


weights = np.exp(np.linspace(-1., 0., N)) 
weights /= weights.sum() 
print "Weights", weights 


c= np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True) 
ema = np.convolve (weights, c) [N-1:-N+1] 
t = np.arange(N - 1, len(c)) 


plot(t, c[N-1:], lw=1.0) 
plot(t, ema, lw=2.0) 
Show() 
二 HL 
3.23 布 林带 





布 林带 ( Bollinger band ) 又 是 一 种 技术 指标 。 是 的 ， 股 票 市 场 的 确 有 成 千 上 万 种 技术 指标 。 
布 林带 是 以 发 明 者 约翰 布 林 格 (John Bollinger ) 的 名 字 命 名 的 ， 用 以 刻画 价格 波动 的 区 间 。 布 
林带 的 基本 型 态 是 由 三 条 轨道 线 组 成 的 带 状 通道 (中 轨 和 上 、 下 轨 各 一 条 )。 


口 中 轨 简单 移动 平均 线 。 

口上 轨 ” 比 简单 移动 平均 线 高 两 倍 标准 差 的 距离 。 这 里 的 标准 差 是 指 计算 简单 移动 平均 线 
所 用 数据 的 标准 差 。 

口 下 轨 比 简单 移动 平均 线 低 两 倍 标准 差 的 距离 。 

















3.24 动手 实践 : 绘制 布 林带 


我 们 已 经 掌握 了 计算 简单 移动 平均 线 的 方法 。 如 有 需要 ， 请 复习 3.20 节 “动手 实践 : 计算 简 
单 移动 平均 线 ” 的 内 容 。 接 下 来 的 例子 将 介绍 NumPy 中 的 fi11 函 数 。fi11 函 数 可 以 将 数组 元 素 
的 值 全 部 设置 为 一 个 指定 的 标量 值 ， 它 的 执行 速度 比 使 用 array .flat = scalaz 或 者 用 循环 遍 
历数 组 赋值 的 方法 更 快 。 按 照 如 下 步 又 绘制 布 林带 。 


(1) 我 们 已 经 有 一 个 名 为 sma 的 数组 ， 包 含 了 简单 移动 平均 线 的 数据 。 因 此 ， 我 们 首先 要 遍 
历 和 这 些 值 有 关 的 数据 子 集 。 数 据 子 集 构建 完成 后 ， 计 算 其 标准 差 。 注 意 ， 从 某 种 意义 上 来 说 ， 
我 们 必须 去 计算 每 一 个 数据 点 与 相应 平均 值 之 间 的 差 值 。 如 果 不 使 用 NumPy, 我 们 只 能 遍历 所 有 
的 数据 点 并 逐一 减 去 相应 的 平均 值 。 垃 运 的 是 ，NumPy 中 的 fi11 函 数 可 以 构建 元 素 值 完全 相同 
的 数组 。 这 可 以 让 我 们 省 去 一 层 循环 ， 当 然 也 就 省 去 了 这 个 循环 内 作 差 的 步 又。 























deviation = [] 
C= lenl(c) 


for i in range(N - 1, C): 
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if 二 NN < CC: 

dev = c[i: i + N] 
else: 

dev = c[-N:] 


averages = np.zeros(N) 
averages.fill(sma[i ~- N - 1]) 
dev = dev - averages 

dev dev ** 2 

dev = np.sdqrt (np.mean (dev)) 
deviation.append (dev) 





deviation = 2 * np.array (deviation) 
upperBB = sma + deviation 
lowerBB = sma - deviation 


(2) 使 用 如 下 代码 绘制 布 林带 ( 不必 担心 ， 我 们 将 在 第 9 章 中 学 习 绘 图 方面 的 知识 ): 





t = numpy.arange(N - 1, C) 
blot(t, ‘CSlice, LTw=Ll;,0) 
plot(t, sma, lw=2.0) 


( 
plot(t, upperBB, lw=3.0) 
plot(t, lowerBB, lw=4.0) 
Show() 





下 图 是 用 我 们 的 示例 数据 绘制 出 来 的 布 林带 。 中 间 锯 齿 状 的 细 线 描绘 的 是 每 天 的 收盘 价 , 而 
稍微 粗 一 点 也 平滑 一 点 的 穿 过 它 的 曲线 即 为 简单 移动 平均 线 。 








390 























刚才 做 了 些 什么 
我 们 在 示例 数据 上 计算 得 到 了 布 林带 。 更 重要 的 是 , 我们 还 了 解 了 NumPy 中 fi11 函 数 的 用 
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法 。 该 函数 可 以 用 一 个 指定 的 标量 值 填 充 数组 ， 而 这 个 标量 值 也 是 fil1 函 数 唯 一 的 参数 。 示 例 
代码 见 bollingerbands.py 文 件 。 








import numpy as np 

import sys 

from matplotlib.pyplot import plot 
from matplotlib.pyplot import show 


N = int(sys.argv[1]) 


weights = np.ones(N) / 'N 
print "Weights", weights 


Cc = np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True) 
sma = np.convolve (weights, c) [N-1:-N+1] 
deviation = [] 


C = lenl(c) 


for i in range(N - 1, C): 
if 4 直 N< Cs 
dev = c[i: i + N] 
else: 
dev = cI[-N:] 


averages = np.zZeros(N) 
averages.fill(sma[i ~- N - 1]) 
dev = dev - averages 

dev = dev ** 2 

dev = np.sqrt(np.mean (dev)) 
deviation.append (dev) 


deviation = 2 * np.array (deviation) 
print len(deviation), len(sma) 
upperBB = sma + deviation 

lowerBB = sma - deviation 


c_slice = c[N-1:] 
between bands = np.where((c_ slice < upperBB) & (c_ slice > lowerBB)) 


print lowerBB[between bands] 

print cl[lbetween bands] 

print upperBBl[between bands] 

between bands = lenl(np.ravel (between bands)) 

print "Ratio between bands", float(between bands)/lenl(c_ slice) 


t = np.arange(N - 1, C) 
blot(t; tc sliee, 1w=1;0) 


( 
plot(t, sma, lw=2.0) 
plot(t, upperBB, lw=3.0) 
plot(t, lowerBB, lw=4.0) 
Show() 
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勇敢 出 发 : 转换 为 指数 移动 平均 线 


人 们 通常 将 简单 移动 平均 线 作 为 布 林带 的 中 轨 线 。 而 以 指数 移动 平均 线 作为 中 轨 线 也 是 一 
种 流行 的 做 法 ， 因 此 我 们 将 它 留 作 练习 。 如 果 需 要 提示 ， 你 可 以 在 本 章 中 找到 合适 的 示例 。 
验证 一 下 fil11 函 数 的 执行 速度 是 否 真 的 比 使 用 array.flat = scalatr 或 者 用 循环 遍历 
数组 赋值 的 方法 更 快 。 





3.25 ”线性 模型 


许多 科学 研究 中 都 会 用 到 线性 关系 的 模型 。 NumPy 的 1inalg 包 是 专门 用 于 线性 代数 计算 的 。 
下 面 的 工作 基于 一 个 假设 ,就 是 一 个 价格 可 以 根据 N 个 之 前 的 价格 利用 线性 模型 计算 得 出 。 

















3.26 ”动手 实践 : 用 线性 模型 预测 价格 


我 们 姑且 假设 ,一 个 股价 可 以 用 之 前 股价 的 线性 组 合 表示 出 来 , 也 就 是 说 , 这 个 股价 等 于 之 
前 的 股价 与 各 自 的 系数 相 乘 后 再 做 加 和 的 结果 , 这 些 系数 是 需要 我 们 来 确定 的 。 用 线性 代数 的 术 
语 来 讲 ， 这 就 是 解 一 个 最 小 二 乘法 的 问题 。 步 又 如 下 。 

(1) 首先 ， 获 取 一 个 包含 N 个 股价 的 向量 b。 

b = c[-N:] 

专 : 三 : BL33=L] 

Drint. "HB™, 区 

输出 结果 如 下 : 

b: [ 351.99 346.67 352.47 355.76 355.36] 

(2) 第 二 步 ， 初 始 化 一 个 NxN 的 二 维 数 组 A， 元 素 全 部 为 0。 


A = np.zeros((N, N), float) 
print "Zeros N by N", A 























Zeros N byN [[ 0. 0. 0. 0. 0.] 
[ 0 0 0, 0, 0., 
[0 0 0 0: .0 
[0. 0. 0. .0 
[ O00: 0. 0 0:11 
(3) 第 三 步 ， 用 b 向 量 中 的 N 个 股价 值 填充 数组 A。 





for i in range(N): 
Ali, 1 =:G[=2N = 1 = 1 = 1 = 11 
print "A", A 
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现在 ， 数 组 A 变 成 了 这 样 : 


A [[ 360. 355.36 355.76 352.47 346.67] 
359.56 360 355.536 .355.,76 .352:47] 
352.12, 359256.-360， 355.36 355.76] 
349.31 352.12 359.56 360. 355.36] 

] 


[ 
[ 
[ 
L 353.2L 349,.31 352.12- 359.。56 360, 】 





(4) 我 们 的 目标 是 确定 线性 模型 中 的 那些 系数 ， 以 解决 最 小 平方 和 的 问题 。 我 们 使 用 1inalg 
包 中 的 1stsq 函 数 来 完成 这 个 任务 。 





(x, residuals, rank, s) = np.linalg.lstsq(A, b) 
print x, residuals, rank, s 

人 

输出 结果 如 下 : 


[ 0.78111069 -1.44411737 1.63563225 -0.89905126 0.92009049] 
[] 5 [ 1.77736601le+03 1.49622969e+01 8.75528492e+00 5.15099261e+00 1.75199608e+00] 


返回 的 元 组 中 包含 稍 后 要 用 到 的 系数 向 量 x、 一 个 残 差 数组 、A 的 秩 以 及 A 的 奇异 值 。 

(5) 一 旦 得 到 了 线性 模型 中 的 系数 ， 我 们 就 可 以 预测 下 一 次 的 股价 了 。 使 用 NumPy 中 的 got 
函数 计算 系数 向 量 与 最 近 N 个 价格 构成 的 向 量 的 点 积 (dot product )。 

print numpy.dot(b，x) 

这 个 点 积 就 是 向 量 b 中 那些 价格 的 线性 组 合 ， 系 数 由 向 量 x 提 供 。 我 们 得 到 如 下 结 

357.939161015 


我 查 了 一 下 记录 ,下 一 个 交易 日 实际 的 收盘 价 为 353.56。 因 此 , 我们 用 N= 5 做 出 的 预测 结 
并 没有 差 得 很 远 。 





刚才 做 了 些 什么 


我 们 预测 了 明天 的 股价 。 如 果 这 真 的 有 效 , 我 们 就 可 以 提早 退休 了 ! 你 看 , 买 这 本 书 是 多 么 
正确 的 投资 ! 我 们 为 股价 预测 建立 了 一 个 线性 模型 ， 于 是 这 个 金融 问题 就 变 成 了 一 个 线性 代数 问 
题 。NumPy 中 的 1inalg 包 里 有 一 个 1stsq 函 数 ， 帮 助 我 们 求 出 了 问题 的 解 一 一 即 估计 线性 模型 
中 的 系数 。 在 得 到 解 之 后 ， 我 们 将 系数 应 用 于 NumPy 中 的 dot 函 数 ， 通 过 线性 回归 的 方法 预测 了 
下 一 次 的 股价 。 示 例 代码 见 linearmodel.py 文 件 。 





















































import numpy as np 
import sys 


N = int(sys.argv[1]) 


c= np.loadtxt('data.csv', delimiter=',', usecols=(6,), unpack=True) 
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她 = el=N:] 
b = bl[l::-1] 
print "Hr; 1 


A = np.zeros((N, N), float) 
print "Zeros N by N", A 


for i in range(N): 
A[i, ] = cI[-N-1-i:-1-i] 


Deint: TA A 
(x, residuals, rank, s) = np.linalg.lstsq(A, b) 
print x, residuals, rank, s 


print Tp.dot(b; x) 


3.27 ”趋势 线 


趋势 线 , 是 根据 股价 走势 图 上 很 多 所 谓 的 枢 轴 点 绘 成 的 曲线 。 顾 名 思 义 ,趋势 线 描绘 的 是 价 
格 变化 的 趋势 ,过 去 的 股民 们 在 纸 上 用 手绘 制 趋势 线 , 而 现在 我 们 可 以 让 计算 机 来 帮助 我 们 作 图 。 
在 这 一 节 的 教程 中 , 我 们 将 用 非常 简易 的 方法 来 绘制 趋势 线 ， 可 能 在 实际 生活 中 不 是 很 奏效 , 但 
这 应 该 能 将 趋势 线 的 原理 曾 述 清楚 。 














3.28 ”动手 实践 : 绘制 趋势 线 
按照 如 下 步 又 绘制 趋势 线 。 


(1) 首先 ， 我们 需要 确定 枢 轴 点 的 位 置 。 这 里 ,我 们 假设 它们 等 于 最 高 价 、 最 低 价 和 收盘 价 
的 算术 平均 值 。 


h, 1, cc = np.loadtxt('data.csv', delimiter=',', usecols=(4, 5, 6), unpack=True) 





Divots s(t 1 )}) 73 
print "Pivots",;, Plivots 


从 这 些 枢 轴 点 出 发 , 我 们 可 以 推导 出 所 谓 的 阻力 位 和 支撑 位 。 阻 力 位 是 指 股价 上 升 时 遇 到 阻 
力 , 在 转 跌 前 的 最 高 价格 ; 支撑 位 是 指 股价 下 跌 时 遇 到 支撑 ,在 反弹 前 的 最 低 价 格 。 需 要 提醒 的 
是 ,阻力 位 和 支撑 位 并 非 客 观 存在 ,它们 只 是 一 个 佑 计量。 基于 这 些 估 计量 ， 我们 就 可 以 绘制 出 
阻力 位 和 支撑 位 的 趋势 线 。 我 们 定义 当日 股价 区 间 为 最 高 价 与 最 低 价 之 差 。 

(2) 定义 一 个 函数 用 直线 y= at + pb 来 拟 合 数据 ， 该 函数 应 返回 系数 a 和 b。 这 里 需要 再 次 用 
到 1inalg 包 中 的 lstsq 函 数 。 将 直线 方程 重 写 为 y = Ax 的 形式 ,其 中 A = [t 1], x= [a bl]。 
使 用 ones_1ike 和 vstack 函 数 来 构造 数组 和 A。 
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def fit_line(t, y): 
A = np.vstack([t, np.ones_like(t)]).T 
return np.linalg.lstsq(A, y)[0] 


(3) 假设 支撑 位 在 枢 轴 点 下 方 一 个 当日 股价 区 间 的 位 置 ， 而 阻力 位 在 枢 轴 点 上 方 一 个 当日 股 
价 区 间 的 位 置 ， 据 此 拟 合 支撑 位 和 阻力 位 的 趋势 线 。 








t = np.arange (len(c)) 

sa, sb = fit line(t, pivots - (h - 1)) 
ra, rb = fit line(t, pivots + (h - 1)) 
support = sa * 七 + Sb 

resistance = ra * 七 + rb 


(4) 到 这 里 我 们 已 经 获得 了 绘制 趋势 线 所 需要 的 全 部 数据 。 但 是 ,我们 最 好 检查 一 下 有 和 多少 
个 数据 点 落 在 支撑 位 和 阻力 位 之 间 。 显 然 , 如 果 只 有 一 小 部 分 数据 在 这 两 条 趋势 线 之 间 , 这样 的 
设 定 就 没有 意义 。 设 置 一 个 判断 数据 点 是 否 位 于 趋势 线 之 间 的 条 件 ， 作 为 where 函 数 的 参数 。 





condition = (c > support) & (c < resistance) 
print "Condition", condition 
between bands = np.where (condition) 


以 下 是 根据 条 件 判 断 的 布尔 值 : 


Condition [False False True True True True True False False True False False 
False False False True False False False True True True True False False True True 
True False True] 


复查 一 下 具体 取 值 : 


print support[between bands] 
print cl[between bands] 
print resistance[between_ bands] 


注意 ,where 国 数 返回 的 是 一 个 秩 为 2 的 数组 , 因此 在 使 用 len 函 数 之 前 需要 调用 ravel1 函 数 。 





between bands = lenl(np.ravel (between bands)) 
print "Number points between bands", between bands 
print "Ratio between bands", float(between bands)/len(c) 


你 将 得 到 如 下 结 


Number points between bands 15 
Ratio between bands 0.5 


我 们 还 得 到 了 一 个 额外 的 奖励 : 一 个 新 的 预测 模型 。 我 们 可 以 用 这 个 模型 来 预测 下 一 个 交易 
日 的 阻力 位 和 支撑 位 。 


print "Tomorrows support", sa * (t[-1] + 1) + sb 
print "Tomorrows resistance", ra * (t[-1] + 1) + rb 


输出 结果 如 下 : 


Tomorrows support 349.389157088 
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Tomorrows resistance 360.749340996 


此 外 ， 还 有 另外 一 种 计算 支撑 位 和 阻力 位 之 间 数 据点 个 数 的 方法 : 使 用 [] 和 intersect1g 
函数 。 在 [] 操 作 符 里 面 定 义 选取 条 件 ， 然 后 用 intersect1dq 函 数 计算 两 者 相交 的 结 
al = c[c > support] 


a2 = c[c < resistance] 
print "Number of points between bands 2nd approach" ,len(np. intersectld(al, a2)) 


如 我 们 所 料 ， 得 到 的 结果 如 下 : 
Number of points between bands 2nd approach 15 
(5) 我 们 再 次 将 结果 绘制 出 来 ， 如 下 所 示 : 


plot(t; ©} 

plot(t, support) 
plot(t, resistance) 
Show() 


绘制 结果 如 下 图 所 示 ， 其 中 包含 了 股价 数据 以 及 对 应 的 支撑 位 和 阻力 位 。 



































刚才 做 了 些 什么 


我 们 用 NumPy 画 出 了 趋势 线 , 省 去 了 用 尺 、 铅 笔 和 绘图 纸 的 麻烦 。 我们 定义 了 一 个 用 直线 拟 
合 数据 的 函数 ， 其 中 用 到 NumPy 中 的 vstack、ones_1ike 和 1stsqg 函 数 。 拟 合 数据 是 为 了 得 到 
支撑 位 和 阻力 位 两 条 趋势 线 的 方程 。 随 后, 我 们 用 两 种 不 同 的 方法 分 别 计算 了 有 和 多少 个 数据 点 落 
在 支撑 位 和 阻力 位 之 间 的 范围 内 ， 并 得 到 了 一 致 的 结果 。 
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第 一 种 方法 使 用 where 函 数 和 一 个 条 件 表达 式 。 第 二 种 方法 使 用 [1] 操作 符 和 intersect1ld 拯 
数 。intersect1d 函 数 返 回 一 个 由 两 个 数组 的 所 有 公共 元 素 构 成 的 数组 。 示 例 代码 见 trendline.py 


文件 。 
import numpy as np 
from matplotlib.pyplot import plot 


from matplotlib.pyplot import show 


def fit line(t; y): 
A = np.vstack([t, np.ones_ like(t)]).T 


return np.linalg.lstsql(A, y) [0] 


i, 1 tT np loadtxt('data.csv', delimiter=","  , USeCoLs=(4,; 5, 6), 


Bivots = (+ 1+4+G)/ 3 
print "Pivots", pivots 


t = np.arange (len(c)) 
sa, sb = fit_ line(t, pivots - (h - 1)) 
ra, rb = fit line(t, pivots + (h - 1)) 


support = sa * 七 + Sb 

resistance = ra * 七 + rb 

condition = (c > support) & (c < resistance) 

print "Condition", condition 

between bands = np.where (condition) 

print support[between bands] 

print cl[lbetween bands] 

print resistance[between_ bands] 

between bands = lenl(np.ravel (between bands)) 

print "Number points between bands", between bands 
print "Ratio between bands", float(between bands)/len(c) 


print "Tomorrows support", sa * (t[-1] + 1) + sb 
print "Tomorrows resistance", ra * (t[-1] + 1) + rb 


al = c[c > support] 
a2 = cf[c < resistancel] 


unpack=True) 


print "Number of points between bands 2nd approach" ,len(np. intersectld(al, a2)) 


ltt 让 3 

plot(t, support) 
plot(t, resistance) 
Show() 


3.29 mndarray 对 象 的 方法 
人 了 许多 方法 , 可 以 在 数组 对 象 上 直接 调用 。 通 常 

















常情 况 下 , 这 些 方 


凌 会 返回 一 个 数组 。 你 可 能 已 经 注意 到 了 ， 很 多 NumPy 函 数 都 有 对 应 的 相同 的 名 字 和 功能 的 





ndarray 对 象 。 ee 过 程 中 的 历史 原因 造成 的 。 
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ndarray 对 象 的 方法 相当 多 ,我 们 无 法 在 这 里 逐一 介绍 ,前 面 遇 到 的 var .sum、std、argmax、 
argmin 以 及 mean 了 国 数 也 均 为 ndqarravy 方 法 。 


数组 的 修剪 和 压缩 请 参见 下 一 节 中 的 内 容 。 


3.30 ”动手 实践 : 数组 的 修剪 和 压缩 

这 里 给 出 少量 使 用 ndqaarray 方 法 的 例子 。 按 如 下 步骤 对 数组 进行 修剪 和 压缩 操作 。 

(1) clip 方 法 返回 一 个 修剪 过 的 数组 ,也 就 是 将 所 有 比 给 定 最 大 值 还 大 的 元 素 全 部 设 为 给 定 
的 最 大 值 ， 而 所 有 比 给 定 最 小 值 还 小 的 元 素 全 部 设 为 给 定 的 最 小 值 。 例如, 设 定 范围 1 到 2 对 0 到 4 
的 整数 数组 进行 修剪 : 

a = np.arange(5) 


Drdnt "a eV 
print "Clipped", a.clip(1, 2) 


输出 结果 如 下 : 


a= [0123 4] 
Clipped [1 1 2 2 2] 


(2) compress 方 法 返回 一 个 根据 给 定 条 件 筛选 后 的 数组 。 例 如 : 
a = np.arange(4) 


print a 
print "Compressed", a.compress(a > 2) 


输出 结果 如 下 : 


[ 012 3] 
Compressed [3] 

















刚才 做 了 些 什么 


我 们 创建 了 一 个 0 到 3 的 整数 数组 a， 然 后 调用 compress 方 法 并 指定 条 件 a > 2， 从 而 获取 到 
了 该 数组 中 的 最 后 一 个 元 素 3。 


3.31 阶乘 
许多 程序 设计 类 的 书籍 都 会 给 出 计算 阶乘 的 例子 ， 我 们 应 该 保持 这 个 传统 。 
3.32 ”动手 实践 : 计算 阶乘 
ndqarray 类 有 一 个 brod 方 法 ， 可 以 计算 数组 中 所 有 元 素 的 乘积 。 按 如 下 步 又 计算 阶乘 。 
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(1) 计算 8 的 阶乘 。 为 此 ， 先 生成 一 个 1~8 的 整数 数组 ， 并 调用 prod 方 法 。 
b = np.arange(1，9) 


Brint "Bb a"; BB 
print "Factorial", b.prod() 


你 可 以 用 计算 需 检 查 一 下 结果 是 否 正确 : 


bs [L2345€ 7 8] 
Factorial 40320 


这 很 不 错 ， 但 如 果 我 们 想 知 道 1~8 的 所 有 阶乘 值 呢 ? 
(2) 没 问 题 ! 调用 cumprod 方 法 ， 计 算数 组 元 素 的 累积 乘积 。 

















print "Factorials", b.cumprod() 
再 次 检查 一 下 结果 吧 : 


Factorials [ 王 2 6 24 二 20 720 5040 40320] 


刚才 做 了 些 什么 


我 们 使 用 proda 和 cumproda 方 法 计算 了 阶乘 。 示 例 代 码 见 ndarraymethods.py 文 件 。 


import numpy as np 


a = np.arange(5) 
print “a =", a 
Brint "CLIIDDEd"; dCLI1iS(L,;, 2) 


a = np.arange(4) 

print a 

print "Compressed", a.compress(a > 2) 
b = np.arange(1, 9) 

六 

print "Factorial", b.prod() 


print "Factorials", b.cumprod() 


3.33 本章 小 结 


本 章 我 们 学 习 了 很 多 常用 的 NumPy 函 数 。 我 们 用 1oaqtxt 读 文件 ， 用 savetxt 写 文件 ， 用 
eye 函数 创建 单位 矩阵 ， 用 loadqtxt 函 数 从 一 个 CSV 文 件 中 读 取 股价 数据 。NumPy 中 的 average 
和 mean 函 数 可 以 用 来 计算 数据 的 加 权 平均 数 和 算术 平均 数 。 


本 章 还 提 到 了 一 些 常用 的 统计 函数 。 首 先 ， 我 们 使 用 min 和 max 函 数 来 确定 股价 的 范围 ; 然 
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后 ， 用 median 函 数 获取 数据 的 中 位 数 ; 最 后 ， 用 stda 和 va 函数 计算 数据 的 标准 差 和 方差 。 

qiff 哨 数 可 以 返回 数组 中 相 邻 元 素 的 差 值 ， 因 此 我 们 用 它 来 计算 股票 的 简单 收益 率 。1og 
函数 可 以 计算 数组 元 素 的 自然 对 数 。 

loadtxt 了 辑 数 默认 将 所 有 数据 转换 为 浮 点 数 类 型 , 它 有 一 个 特定 的 参数 可 以 完成 转换 。 这 个 
参数 就 是 converters， 它 是 一 个 可 以 将 数据 列 和 所 谓 的 转换 函数 连接 起 来 的 参数 。 

我 们 自 定义 了 一 个 函数 并 将 其 作为 参数 传 给 了 apply_along_axis 函 数 。 我 们 实现 了 一 个 
可 以 在 多 个 数组 间 找 出 每 个 位 置 上 最 大 元 素 的 算法 。 

我 们 了 解 到 ones 函 数 可 以 创建 一 个 全 为 1 的 数组 ， 而 且 convolve 函 数 可 以 根据 指定 的 权重 
计算 卷 积 。 


我 们 用 exp 和 1inspace 函 数 得 到 了 一 组 指数 衰减 的 权重 值 , 1inspace 可 以 给 出 一 个 均匀 分 
布 的 数组 ， 然 后 我 们 计算 出 该 数组 元 素 的 指数 。 我 们 还 调用 ndqarray 类 的 sum 方 法 对 权重 值 做 归 


我 们 还 接触 到 了 £i11 函 数 ， 这 个 函数 可 以 用 一 个 指定 的 标量 值 填充 数组 ， 而 这 个 标量 值 也 
是 其 唯一 的 参数 。 


结束 了 本 章 的 NumPy 常 用 函数 之 旅 ， 我 们 将 来 到 NumPy 便 捷 函 数 的 世界 。 下 一 章 将 学 习 
polyfit、sign 和 piecewise 等 NumPy 函 数 。 
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第 4 章 


便捷 函数 








你 可 能 已 经 发 现 ，NumPy 中 包含 大 量 的 函数 。 其 实 很 多 函数 的 设计 初衷 
都 是 为 了 让 你 能 更 方便 地 使 用 。 了 解 这 些 函 数 ， 你 可 以 大 大 提升 自己 的 工作 
效率 。 这 些 函 数 包 括 数组 元 素 的 选取 ( 例如， 根据 某 个 条 件 表 达 式 ) 和 多 项 
式 运算 等 。 计 算 股 票 收益 率 相 关 性 的 例子 将 让 你 浅 尝 NumPy 数 据 分 析 。 





本 章 涵盖 以 下 内 容 : 
口 数据 选取 ; 
口 简单 数据 分 析 ; 
口 收益 率 相关 性 ; 
口 多 项 式 ; 
口 线性 代数 的 计算 函数 。 
在 前 一 章 中 , 我 们 只 用 到 了 一 个 数据 文件 。 本 章 将 有 重要 的 改进 一 一 我 们 同时 用 到 两 个 数据 
文件 。 让 我 们 继续 前 进 ， 携 手 NumPy 一 起 探索 数据 吧 。 





4.1 相关 性 


不 知 你 是 否 注 意 过 这 样 的 现象 : 某 公 司 的 股价 被 男 外 一 家 公司 的 股价 紧 紧 跟随 , 并 且 它 们 通 
常 是 同 领域 的 苋 争 对 手 。 对 于 这 种 现象 , 理论 上 的 解释 是 : 因为 这 两 家 公司 经 营 的 业务 类 型 相同 ， 
它们 面临 同样 的 挑战 ， 需 要 相同 的 原料 和 资源 ， 并 且 争 夺 同 类 型 的 客户 。 

你 可 能 会 想到 很 多 这 样 的 例子 , 但 还 想 检 验 一 下 它们 是 否 真 的 存在 关联 。 一 种 方法 就 是 看 看 
两 个 公司 股票 收益 率 的 相关 性 ， 强 相关 性 意味 着 它们 之 间 存 在 一 定 的 关联 性 。 当 然 ， 这 不 是 严格 
的 证 明 ， 特 别 是 当 我 们 所 用 的 数据 不 够 充足 时 。 
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4.2 动手 实践 : 股票 相关 性 分 析 


在 本 节 的 教程 中 ， 我 们 将 使 用 2 个 示例 数据 集 提供 收盘 价 数据 ， 其 中 包含 收盘 价 的 最 小 值 。 
第 一 家 公司 是 BHP Billiton (BHP )， 其 主要 业务 是 石油 、 金 属 和 钻石 的 开采 。 第 二 家 公司 是 Vale 
( VALE )， 也 是 一 家 金属 开采 业 的 公司 。 因 此 ， 这 两 家 公司 有 部 分 业务 是 重合 的 ， 尽管 不 是 100% 
相同 。 按 照 如 下 步骤 分 析 它 们 股票 的 相关 性 。 


(1) 首先 ， 从 CSV 文 件 ( 本 章 示 例 代码 文件 夹 中 ) 中 读 入 两 只 股票 的 收盘 价 数 据 ， 并 计算 收 
益 率 。 如 果 你 不 记得 该 怎样 做 ， 在 前 一 章 中 有 很 多 可 以 参阅 的 例子 。 

(2) 协 方差 描述 的 是 两 个 变量 共同 变化 的 趋势 ， 其 实 就 是 归 一 化 前 的 相关 系数 。 使 用 cov 函 
数 计算 股票 收益 率 的 协 方差 矩阵 (并非 必须 这 样 做 , 但 我 们 可 以 据 此 展示 一 些 矩 阵 操作 的 方法 )。 



































covariance = mnp.cov(bhp_returns，vVale_returns ) 
print "Covariance", covariance 


得 到 的 协 方差 矩阵 如 下 : 


Covariance [[ 0.00028179 0.00019766] 
[ 0.00019766 0.00030123]] 


(3) 使 用 aiagonal 函 数 查 看 对 角 线 上 的 元 素 : 
print "Covariance diagonal", covariance.diagonal () 
得 到 协 方差 矩阵 的 对 角 线 元 素 如 下 : 


Covariance diagonal [ 0.00028179 0.00030123] 








| 协 方差 矩阵 中 对 角 线 上 的 元 素 并 不 相等 ， 这 与 相关 系数 矩阵 是 不 同 的 。 | 


(4) 使 用 trace 隐 数 计算 矩阵 的 迹 ， 即 对 角 线 上 元 素 之 和 : 
print "Covariance trace", covariance.trace() 

计算 出 协 方差 矩阵 的 迹 如 下 : 

Covariance trace 0.00058302354992 


(5) 两 个 向 量 的 相关 系数 被 定义 为 协 方差 除 以 各 自 标 准 差 的 乘积 。 计 算 向 量 a 和 b 的 相关 系数 
的 公式 如 下 。 





a,b 
corr(a,b)=-Co (20) 2b) 
b 


So, So, 
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尝试 一 下 : 
print covariance/ (bhp_returns.std() * vale _ returns.std!()) 
得 到 的 矩阵 如 下 : ? 


[[ 1.00173366 0.70264666] 
[ 0.70264666 1.0708476 ]] 


(6) 我 们 将 用 相关 系数 来 度量 这 两 只 股票 的 相关 程度 。 相 关系 数 的 取 值 范 围 在 -1 到 1 之 间 。 
根据 定义 ， 一 组 数值 与 自身 的 相关 系数 等 于 1。 这 是 严格 线性 关系 的 理想 值 ， 实 际 上 如 果 得 到 稍 
小 一 些 的 值 ， 我 们 仍然 会 很 高 兴 。 使 用 corrcoef 函 数 计算 相关 系数 ( 或 者 更 精确 地 ， 相 关系 数 
和 矩阵 ): 


print "Correlation coefficient", np.corrcoef (bhp_returns, vale returns) 
得 到 的 相关 系数 矩阵 如 下 : 


[[ 1. 0.678417471] 
[ 0.67841747 1. ]] 


对 角 线 上 的 元 素 即 BHP 和 VALE 与 自身 的 相关 系数 , 因此 均 为 1, 很 可 能 并 非 真 的 经 过 计算 得 
出 。 相 关系 数 和 矩阵 是 关于 对 角 线 对 称 的 ， 因 此 另外 两 个 元 素 的 值 相等 ， 表 示 BHP 与 VALE 的 相关 
系数 等 于 VALE 和 BHP 的 相关 系数 。 看 起 来 它们 的 相关 程度 似乎 不 是 很 强 。 


(7) 另外 一 个 要 点 是 判断 两 只 股票 的 价格 走势 是 否 同步 。 如 果 它 们 的 差 值 偏离 了 平均 差 值 2 
音 于 标准 差 的 距离 ， 则 认为 这 两 只 股票 走势 不 同步 。 


若 判 断 为 不 同步 , 我 们 可 以 进行 股票 交易 ,等 待 它们 重新 回 到 同步 的 状态 。 计 算 这 两 只 股票 
收盘 价 的 差 值 ， 以 判断 是 否 同 步 : 


























difference = bhp - vale 


检查 最 后 一 次 收盘 价 是 否 在 同步 状态 ， 代 码 如 下 : 





Q@ 本 书 作者 将 该 矩阵 称 为 相关 系数 矩阵 ， 译 者 保留 不 同 观 点 。 我 们 知道 ， 相 关系 数 和 矩阵 的 主 对 角 线 元 素 为 随机 变量 
与 自身 的 相关 系数 ， 应 该 等 于 1。 因 此 这 一 步 得 到 的 矩阵 并 非 相 关系 数 和 矩阵 ， 而 下 一 步 中 的 才 是 。 读 者 可 能 有 这 
样 的 疑问 ， 为 何 这 里 按照 相关 系数 的 定义 手动 计算 出 来 的 矩阵 并 非 相 关系 数 和 矩阵 呢 ?” 主 要 有 两 点 原因 : (1) 分 母 
不 应 为 定 值 ， 而 要 根据 分 子 上 的 协 方差 计算 对 象 确定 。 以 左上 角 的 元 素 为 例 ， 由 于 其 分 子 为 cov (a，a) ， 即 随机 
变量 a 和 其 自身 的 协 方差 ， 则 分 母 对 应 为 (php_returns.std() * php_returns.std())。 其 他 位 置 的 元 素 计算 
同 理 。(2) 即使 按照 这 一 步 给 出 的 算式 ， 副 对 角 线 上 的 元 素 也 应 该 是 正确 的 相关 系数 ， 但 为 何 与 下 一 步 中 的 副 对 

角 线 仍 不 一 致 呢 ? 这 是 由 于 NumPy 在 计算 协 方差 时 ， 自 由 度 参数 默认 为 1， 即 分 母 为 N-1 而 不 是 Y， 从 而 求 得 总 体 

协 方差 的 无 偏 估计 。 而 调用 .std() 计算 标准 差 时 ， 自 由 度 参 数 默认 为 0， 从 而 求 得 的 是 样本 标准 差 ， 而 非 总 体 标 

准 差 的 无 偏 估 计 。 因 此 ， 这 一步 计算 的 副 对 角 线 元 素 也 并 非 正 确 的 相关 系数 。 译 者 测试 了 作者 提供 的 源 代码 ， 如 

果 在 调用 .sta() 方 法 时 指定 aaof=1， 即 自由 度 设 为 1， 就 可 以 得 到 与 下 一 步 计 算 结 果 相同 的 副 对 角 线 元 素 。 如 前 

所 述 ， 大 分 别 计算 各 个 元 素 的 分 母 ， 即 可 得 到 主 对 角 线 为 1、 完 全 正确 的 相关 系数 矩阵 。 一 一 译 者 注 

















































































































































































































图 灵 社 区 会 员 heruihong 专 享 尊重 版 权 





4.2 动手 实践 : 股票 相关 性 分 析 73 





avg = np.mean (difference) 
dev = np.std(difference) 
print "Out of sync", np.abs (difference[-1] - avg) > 2 * dev 


遗憾 的 是 ， 我 们 暂时 不 能 进行 交易 : 
Out of sync False 
(8) 绘图 需要 Matplot1lib 库 ， 我 们 将 在 第 9 章 中 详细 讲解 。 使 用 如 下 代码 进行 绘图 : 


t = np.arange(len(bhp_returns)) 
plot(t, bhp_returns, lw=1) 
plot(t, vale_ returns, lw=2) 
Show() 


结果 如 下 。 
































刚才 做 了 些 什么 


我 们 分 析 了 两 只 股票 BHP 和 VALE 收 盘 价 的 相关 性 。 更 准确 地 说 ， 我 们 计算 了 其 收益 率 的 相 
关系 数 。 这 可 以 用 corrcoef 函 数 来 计算 。 我 们 还 了 解 了 协 方差 矩阵 的 计算 过 程 ， 并 可 以 据 此 计 
算 相关 系数 。 我 们 也 因此 展示 了 diagonal 函 数 和 trace 函 数 的 用 法 ， 分别 可 以 给 出 矩阵 的 对 角 
线 元 素 和 和 矩 阵 的 迹 。 示 例 代码 见 correlation.py 文 件 。 

import numpy as np 


from matplotlib.pyplot import plot 
from matplotlib.pyplot import show 


bhp = np.loadtxt('BHP.csv', delimiter=',', usecols=(6,), unpack=True) 
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bhp_returns = np.diff(bhp) / bhp[ : -1] 
vale = np.loadtxt('VALE.csv', delimiter=',', usecols=(6,), unpack=True) 
vale_ returns = np.diff(vale) / vale[ : -1] 


Covariance = np.cov(bhp_returns, vale returns) 
print "Covariance", covariance 


print "Covariance diagonal", covariance.diagonal () 
print "Covariance trace", covariance.trace!() 


print covariance/ (bhp_returns.std() * vale returns.std!()) 
print "Correlation coefficient", np.corrcoef (bhp_returns, vale_ returns) 
difference = bhp - vale 


avg = np.mean (difference) 
dev np.std(difference) 


ll 


print "Out of sync", np.abs(difference[-1] - avg) > 2 * dev 


t = np.arange (len(bhp_returns)) 
plot(t, bhp_returns, lw=1) 
plot(t, vale returns, lw=2) 
show () 





突击 测验 : 计算 协 方差 


问题 1 以 下 哪个 函数 返回 的 是 两 个 数组 的 协 方 差 ? 


(1) covariance 


(2) covar 
(3) cov 


(4) cvar 





4.3 多项式 


你 喜欢 微 积 分 吗 ? 我 非常 喜欢 ! 在 微 积分 里 有 泰勒 展开 的 概念 , 也 就 是 用 一 个 无 穷 级 数 来 表 
示 一 个 可 微 的 函数 。 实 际 上 ， 任 何 可 微 的 ( 从 而 也 是 连续 的 ) 函数 都 可 以 用 一 个 N 次 多 项 式 来 估 
计 ， 而 比 N 次 窜 更 高 阶 的 部 分 为 无 穷 小 量 可 忽略 不 计 。 


























4.4 动手 实践 : 多 项 式 拟 合 


NumPy 中 的 ployfit 函 数 可 以 用 多 项 式 去 拟 合 一 系列 数据 点 ,无 论 这 些 数据 点 是 否 来 自 连续 
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函数 都 适用 。 


(1) 我 们 继续 使 用 BHP 和 VALE 的 股票 价格 数据 。 用 一 个 三 次 多 项 式 去 拟 合 两 只 股票 收盘 价 的 
差价 : 


bhp=np.loadtxt ('BHP.csv', delimiter=',', usecols=(6,), unpack=True) 
vale=np.loadtxt ('VALE.csv', delimiter=',', usecols=(6,),unpack=True) 
t = np.arange(len (bhp)) 


poly = np.polyfit(t, bhp - vale, int(sys.argv[1])) 
print "Polynomial fit", poly 


拟 合 的 结果 为 ( 在 这 个 例子 中 是 一 个 三 次 多 项 式 ): 
Polynomial fit [ 1.11655581e-03 -5.28581762e-02 5.80684638e-01 5.79791202e+01] 


(2) 上 面 看 到 的 那些 数字 就 是 多 项 式 的 系数 。 用 我 们 刚刚 得 到 的 多 项 式 对 象 以 及 polyval 函 
数 ， 就 可 以 推断 下 一 个 值 : 








print "Next value", np.polyval (poly, t[-1] + 1) 
预测 的 下 一 个 值 为 : 
Next value 57.9743076081 


(3) 理想 情况 下 ，BHP 和 VALE 股 票 收盘 价 的 差价 越 小 越 好 。 在 极限 情况 下 ， 差 值 可 以 在 某 个 
点 为 0。 使 用 roots 函 数 找 出 我 们 拟 合 的 多 项 式 函 数 什么 时 候 到 达 0 值 : 


print "Roots"，np.roots (poly) 

解 出 多 项 式 的 根 为 : 

Roots [35.48624287+30.62717062j 35.48624287-30.62717062j -23.63210575 +0.j] 

(4) 我 们 在 微 积分 课程 中 还 学 习 过 求 极 值 的 知识 一 一 极 值 可 能 是 函数 的 最 大 值 或 最 小 值 。 
记 住 微 积 分 中 的 结论 ， 这 些 极 值 点 位 于 函数 的 导数 为 0 的 位 置 。 使 用 polydqer 函 数 对 多 项 式 函 
数 求 导 : 


der = np.polyder (poly) 
print "Derivative", der 


多 项 式 函 数 的 导 函 数 ( 仍然 是 一 个 多 项 式 函数 ) 的 系数 如 下 : 
Derivative [ 0.00334967 -0.10571635 0.58068464] 

你 看 到 的 这 些 数字 即 为 导 函 数 的 系数 。 

(5) 求 出 导数 函数 的 根 ， 即 找 出 原 多 项 式 函 数 的 极 值 点 : 


print "Extremas", np.roots (der) 














图 灵 社 区 会 员 heruihong 专 享 尊重 版 权 





76 第 4 章 便捷 函数 





得 到 的 极 值 点 为 : 

Extremas [ 24.47820054 7.08205278] 

我 们 来 复核 一 下 结果 ， 使 用 polyval 计 算 多 项 式 函 数 的 值 : 
vals = np.polyval (poly, t) 


(6) 现在 ， 使 用 argmax 和 argmin 找 出 最 大 值 点 和 最 小 值 点 : 





vals = np.polyval (poly, t) 
print np.argmax (vals) 
print np.argmin (vals) 


这 将 给 出 如 下 的 结果 : 


7 
24 


与 上 一 步 中 的 结果 不 完全 一 致 ， 不 过 回 到 第 1 步 可 以 看 到 ，t 是 用 arange 函 数 定义 的 。 
(7) 绘制 源 数据 和 拟 合 函数 如 下 : 
plot(t, bhp - vale) 


plot(t, vals) 
Show() 


生成 的 折线 图 如 下 。 
































显然 ,光滑 曲线 为 拟 合 函数 ， 而 锯齿 状 的 为 源 数据 。 拟 合 得 不 算 很 好 ， 因 此 你 可 以 尝试 更 高 
阶 的 多 项 式 拟 合 。 
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刚才 做 了 些 什么 


我 们 使 用 polyfit 函 数 对 数据 进行 了 多 项 式 拟 合 。 我 们 学 习 使 用 polyval 函 数 计算 多 项 式 的 
取 值 ， 使 用 roots 函 数 求 得 多 项 式 函 数 的 根 ， 以 及 polydqez 函 数 求解 多 项 式 函 数 的 导 函 数 。 示 例 
代码 见 polynomials.py 文 件 。 














import numpy as np 

import sys 

from matplotlib.pyplot import plot 
from matplotlib.pyplot import show 


bhp=np.loadtxt ('BHP.csv', delimiter=',', usecols=(6,), unpack=True) 

vale=np.loadtxt ('VALE.csv', delimiter=',', usecols=(6,), unpack=True) 

t = np.arange(len (bhp)) CC 
poly = np.polyfit(t, bhp - vale, int(sys.argv[1])) 


print "Polynomial fit", poly 
print "Next value", np.polyval (poly, t[-1] + 1) 
print "Roots", np.roots (poly) 


der = np.polyder (poly) 
print "Derivative", der 





print "Extremas", np.roots (der) 
vals = np.polyval (poly, t) 
print np.argmax (vals) 

print np.argmin (vals) 


plot(t, bhp - vale) 
plot(t, vals) 
Show() 


勇敢 出 发 : 改进 拟 合 函 数 





本 节 中 的 拟 合 函 数 有 很 多 可 以 改进 的 地 方 。 尝 试 使 用 三 次 方 之 外 的 不 同 指数 ， 或 者 考虑 在 
拟 合 前 对 数据 进行 平滑 处 理 。 使 用 移动 平均 线 就 是 一 种 数据 平滑 的 方法 。 计 算 简 单 移动 平均 线 
和 指数 移动 平均 线 的 示例 可 参阅 前 面 的 章节 。 





4.5 ” 净 额 成 交 量 


成 交 量 ( volume ) 是 投资 中 一 个 非常 重要 的 变量 ， 它 可 以 表示 价格 波动 的 大 小 。OBV 
( On-Balance Volume， 净 额 成 交 量 或 叫 能 量 潮 指标 ) 是 最 简单 的 股价 指标 之 一 ， 它 可 以 由 当日 收 
盘 价 前 一 天 的 收盘 价 以 及 当日 成 交 量 计算 得 出 ,这 里 我 们 以 前 一 日 为 基期 计算 当日 的 OBV 值 ( 可 
以 认为 基期 的 OBV 值 为 0 )。 知 当日 收盘 价 高 于 前 一 日 收盘 价 ， 则 本 日 OBV 等 于 基期 OBV 加 上 当 
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日 成 交 量 。 若 当日 收盘 价 低 于 前 一 日 收盘 价 ， 则 本 日 OBV 等 于 基期 OBV 减 去 当日 成 交 量 。 若 当 
日 收盘 价 相 比 前 一 日 没有 变化 ， 则 当日 成 交 量 以 0 计算 。 


4.6 动手 实践 : 计算 OBV 

换言之 , 我 们 需要 在 成 交 量 前 面 乘 上 一 个 由 收盘 价 变 化 决定 的 正 负 有 号。 在 本 节 教 程 中 , 我 们 
将 学 习 该 问题 的 两 种 解决 方法 ， 一 种 是 使 用 NumPy 中 的 sign 函 数 ， 另 一 种 是 使 用 NumPy 的 
piecewise 卫 数 。 

(1) 把 BHP 数 据 分 别 加 载 到 收盘 价 和 成 交 量 的 数组 中 

c, Vv=np.loadtxt('BHP.csv', delimiter=',', usecols=(6, 7), unpack=True) 

为 了 判断 计算 中 成 交 量 前 的 正 负 号 , 我 们 先 使 用 diff 函 数 计算 收盘 价 的 变化 量 。diff 函 数 可 以 
计算 数组 中 两 个 连续 元 素 的 差 值 ， 并 返回 一 个 由 这 些 差 值 组 成 的 数组 : 























change = np.diff(c) 
print "Change", change 


收盘 价差 值 的 计算 结果 如 下 : 


Change: [| 192" =1:08 =1,.26.063 =1:54 =0:.28 0525 =0Q..60 215.069 =1.33 二 ;16 
lB9° =026. =L.29 0013 =2. 12. S309. L128 =0.57 =207 =2107. 5 Tal8 
=0588 L3124 =0.591 


(C)NumPy 中 的 sign 函 数 可 以 返回 数组 中 每 个 元 素 的 正 负 符 号 , 数组 元 素 为 负 时 返回 -1, 为 
正 时 返回 1， 和 否则 返回 0。 对 change 数 组 使 用 sign 函 数 ; 

signs = np.sign(change) 

Beint: VSLIgNeS", SLigns 

change 数 组 中 各 元 素 的 正 负 符号 如 下 所 示 : 

Signs [ 1. -1. -1. 1. -1. -1. 1. -1. 1. 1. -1. 1. 1. -1. -1. -1. -1. -1. -1. -1. -1. 

| 

另外 , 我 们 也 可 以 使 用 piecewise 函 数 来 获取 数组 元 素 的 正 负 。 顾 名 思 义 ，piecewise' 天 
数 可 以 分 段 给 定 取 值 。 使 用 合适 的 返回 值 和 对 应 的 条 件 调 用 该 也 数 : 














pieces = np.piecewise(change, [change < 0, change > 0], [-1, 1]) 
print "Pieces", pieces 


再 次 输出 数组 元 素 的 正 负 ， 结 果 如 下 : 


Pieces [ Ta SL Sl1s Ts SLs sly Ls = .Ly Ts SLs La 2 sl SL; SL = Sl SL =Ls Sl 
ee | 





@ 英语 中 piecewise 意 为 “分 段 的 "。 一 一 译 者 注 
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识 


查 两 次 的 输出 是 否 一 致 : 
print "Arrays equal?", np.array_equal (signs, pieces) 
结果 如 下 : 


Arrays equal? True 


(3) OBV 值 的 计算 依赖 于 前 一 日 的 收盘 价 ， 所 以 在 我 们 的 例子 中 无 法 计算 首 日 的 OBV 值 : 





print "On balance volume", Vv[1:] * signs 


计算 结果 如 下 : 


[2620800. -2461300. -3270900. 2650200. -4667300. -5359800. 7768400. 
-4799100 . 3448300. 4719800. -3898900. 3727700. 3379400. -2463900 . 
3590900, =3805000;, =3271700.. =5507800; ‘2996800.. =3434800.; =5008300. 
=78097.99:, 3947100. 3809700. 3098200. -3500200. 4285600. 3918800 . 
-3632200.] 





刚才 做 了 些 什么 


我 们 刚刚 计算 了 OBV 值 ， 它 依赖 于 收盘 价 的 变化 量 。 我 们 分 别 使 用 了 NumPy 中 的 sign 函 数 
和 piecewise 函 数 这 两 种 不 同 的 方法 来 判断 收盘 价 变化 量 的 正 负 。 示 例 代 码 见 obvpy 文 件 . 


import numpy as np 
c, v=np.loadtxt('BHP.csv', delimiter=',', usecols=(6, 7), unpack=True) 


change = np.diff(c) 
print "Change", change 


signs = np.sign(change) 
print Siones™, Sions 


pieces = np.piecewise(change, [change < 0, change > 0], [-1, 1]) 
print "Pieces'", pieces 


print "Arrays equal?", np.array_equal (signs, pieces) 


print "On balance volume", Vv[1:] * signs 


4.7 ”交易 过 程 模拟 


你 可 能 经 常 想 尝 试 干 一 些 事情 , 做 一 些 实验 , 但 又 不 希望 造成 任何 不 良 后 果 。 而 NumPy 就 是 
用 于 实验 的 完美 工具 我 们 将 使 用 NumPy 来 模拟 一 个 交易 日 , 当然 , 这 不 会 造成 真正 的 资金 损失 。 
许多 人 喜欢 抄底 ,也 就 是 等 股价 下 跌 后 才 买 人 。 类 似 的 还 有 当 股 价 比 当日 开盘 价 下跌 一 小 部 分 ( 比 
如 0.1% ) 时 买 入 。 
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4.8 动手 实践 : 避免 使 用 循环 

使 用 vectorize 函 数 可 以 减少 你 的 程序 中 使 用 循环 的 次 数 。 我 们 将 用 它 来 计算 单个 交易 日 
的 利润 。 

(1) 首先 ， 读 入 数据 : 


o, h, 1, ¢ = np.loadtxt('BHP.csv', delimiter=',', usecols=(3, 4, 5, 6), unpack=True) 


(2) NumPy 中 的 vectorize 国 数 相 当 于 Python 中 的 map 国 数 。 调 用 vectorize 国 数 并 给 定 
calc_profit 限 数 作为 参数 ， 尽 管 我 们 还 没有 编写 这 个 函数 : 

















func = np.vectorize(calc profit) 

(3) 我 们 现在 可 以 先 把 func 当 做 函数 来 使 用 。 对 股价 数组 使 用 我 们 得 到 的 func 函 数 : 
brofites. = fune(6, ll; ly &) 

(4) calc_profit 消 数 非 常 简单 。 首 先 ， 我 们 尝试 以 比 开 盘 价 稍 低 一 点 的 价格 买 和 股票。 如 果 


这 个 价格 不 在 当日 的 股价 范围 内 , 则 尝试 买 人 失败, 没有 获 利 , 也 没有 亏损 ,我 们 均 返 回 0。 否则 ， 
我 们 将 以 当日 收盘 价 卖 出 ， 所 获得 的 利润 即 买 人 和 卖 出 的 差价 。 事 实 上 ， 计 算 相 对 利润 更 为 直观 : 




















def calc profit((open, high, low, close): 
# 以 比 开盘 价 稍 低 的 价格 买 入 
buy = open * float(sys.argv[1]) 
# daily range 
if low < buy < high : 
return (close - buy)/buy 
else: 
return 0 
print “Profits", Profits 


(5) 在 所 有 交易 日 中 有 两 个 零 利润 日 ， 即 没有 利润 也 没有 损失 。 我 们 选择 非 零 利 润 的 交易 日 
并 计算 平均 值 
real trades = profits[profits != 0] 


print "Number of trades", len(real trades), round(100.0 * len(real trades)/len(c), 2),"%" 
print "Average profit/loss %$", round(np.mean(real_ trades) * 100, 2) 


交易 结果 如 下 : 


Number of trades 28 93.33 % 
Average profit/loss % 0.02 


(6) 乐观 的 人 们 对 于 正人 一 利 的 交易 更 感 兴趣 。 选 择 正 盘 利 的 交易 日 并 计算 平均 利润 : 





winning trades = profits[profits > 0] 
print "Number of winning trades", len(winning_ trades), 
round(100.0 * len(winning trades)/len(c), 2), "%" 
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print "Average profit g%"，round (np .mean (winning_ trades) * 100, 2) 


正 盘 利 交 易 的 分 析 结 果 如 下 : 


Number of winning trades 16 53.33 % 
Average profit % 0.72 





(7) 悲观 的 人 们 对 于 负 和 盈利 的 交易 更 感 兴趣 ,选择 负 一 利 的 交易 日 并 计算 平均 损失 : 


losing_ trades = profits[profits < 0] 

print "Number of losing trades", lenl(losing trades), 
round(100.0 * len(losing trades)/len(c), 2), "%" 

print "Average loss %", round(np.mean(losing trades) * 100, 2) 


人 负 和 一 利 交易 的 分 析 结 果 如 下 : 


Number of losing trades 12 40.0 % 
Average loss % -0.92 





刚才 做 了 些 什么 


我 们 矢量 化 了 一 个 函数 , 这 是 一 种 可 以 避免 使 用 循环 的 技巧 。 我 们 使 用 一 个 能 返回 当日 相对 
利润 的 函数 来 模拟 一 个 交易 日 ， 并 分 别 打印 出 正和 僵 利 和 负 盘 利 交 易 的 概况 。 示 例 代 码 见 


simulation.py 文 件 。 


import numpy as np 
import sys 


o, h, 1, ¢ = np.loadtxt('BHP.csv', delimiter=',', usecols=(3, 4, 5, 6), unpack=True) 


def calc profit(open, high, low, close): 
# 在 开盘 时 买 入 
buy = open * float(sys.argv[1]) 


# 当日 股价 区 间 
if low < buy < high: 
return (close - buy)/buy 
else: 
return 0 


func = np.vectorize(calc profit) 
profits = func(o, h, 1, ©¢) 


print "Profits", profits 


real trades = profits[profits != 0] 


print "Number of trades", lenl(real trades), round(100.0 * len(real_ trades)/lenl(c 


2 和 
print "Average profit/loss %", round(np.meanl(real trades) * 100, 2) 


winning_ trades = profits[profits > 0] 


print "Number of winning trades", len(winning_ trades), round(100.0 * 
len(winning trades)/len(c), 2), "%" 
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9 


print "Average profit %", round(np.mean (winning_ trades) * 100, 2) 


losing_ trades = profits[profits < 0] 
print "Number of losing trades", len(losing trades), round(100.0 * 


9 


len(losing trades)/len(c), 2), "%" 


9 


print "Average loss %", round(np.mean(losing trades) * 100, 2) 





勇敢 出 发 : 分 析 连 续 鳃 利和 亏损 


尽管 平均 利润 为 正 值 , 但 我 们 仍 需 要 了 解 这 段 过 程 中 是 否 有 长 期 连续 亏损 的 状况 出 现 。 这 


一 点 很 重要 ,因为 如 果 出 现 了 连续 亏损 , 我 们 可 能 会 面临 资本 耗 尽 的 情形 ,那么 计算 出 来 的 平 
均 利 润 就 不 可 信 了 。 


请 检查 是 否 出 现 过 这 样 的 连续 亏损 。 如 果 你 乐意 ， 也 可 以 检查 是 否 有 长 时 间 的 连续 愉 利 。 





4.9 





Pe 


数据 平滑 
噪声 数据 往往 很 难处 理 , 因此 我 们 通常 需要 对 其 进行 平滑 处 理 。 除 了 用 计算 移动 平均 线 的 广 








去 ， 我 们 还 可 以 使 用 NumPy 中 的 一 个 函数 来 平滑 数据 。 




















或 


hanning 消 数 是 一 个 加 权 余 弦 的 窗 函 数 。 在 后 面 的 章节 中 ， 我们 还 将 更 为 详细 地 介绍 其 他 


函数 。 


4.10 动手 实践 : 使 用 hanning 函数 平滑 数据 


我 们 将 使 用 hanning 函 数 平滑 股票 收益 率 的 数组 ， 步 又 如 下 。 
(1) 调用 hanning 函 数 计算 权重 ， 生成 一 个 长 度 为 N 的 窗口 〈 在 这 个 示例 中 N 取 8 ): 
N= int(sys.argvl1]) 


weights = np.hanning(N) 
print "Weights", weights 


得 到 的 权重 如 下 : 
Weights [ 0. 0.1882551 0.61126047 0.95048443 0.95048443 0.61126047 
0.1882551 0. ] 


(CO) 使 用 convolve 函 数 计算 BHP 和 VALE 的 股票 收益 率 , 以 归 一 化 处 理 后 的 weights 作 为 参数 : 





bhp = np.loadtxt('BHP.csv', delimiter=',', usecols=(6,),unpack=True) 
bhp_returns = np.diff (bhp) / bhp[ : -1] 

smooth bhp = np.convolve (weights/weights.sum(), bhp_returns) [N-1:-N+1] 
vale = np.loadtxt ('VALE.csv', delimiter=',', usecols=(6,),unpack=True) 
vale_ returns = np.diff(vale) / vale[ : -1] 

smooth vale = np.convolve (weights/weights.sum(), vale returns) [N-1:-N+1] 
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(3) 用 Matplot1ib 绘 图 : 


t = np.arange(N - 1, len(bhp_returns)) 


plot(t, bhp_returns{[N-1:], lw=1.0) 
plot(t, smooth bhp, lw=2.0) 

plot(t, vale returns[N-1:], lw=1.0) 
plot(t, smooth vale, lw=2.0) 

Show() 














1 10 15 20 25 30 











图 中 的 细 线 为 股票 收益 率 , 粗 线 为 平滑 处 理 后 的 结果 。 如 你 所 见 ，, 图 中 的 折线 有 交叉。 这 些 
交叉 点 很 重要 ， 因 为 它们 可 能 就 是 股价 趋势 的 转折 点 ， 至 少 可 以 表明 BHP 和 VALE 之 间 的 股价 关 
系 发 生 了 变化 。 这 些 转 折 点 可 能 会 经 常 出 现 ， 我 们 可 以 利用 它们 预测 未 来 的 股价 走势 。 


(4) 使 用 多 项 式 拟 合 平滑 后 的 数据 : 


K = int(sys.argv[1]) 

t = np.arange(N - 1, len(bhp_returns)) 
poly_bhp = np.polyfit(t, smooth bhp, K) 
poly_vale = np.polyfit(t, smooth vale, K) 


(5) 现在 ， 我 们 需要 解 出 上 面 的 两 个 多 项 式 何 时 取 值 相等 ， 即 在 哪些 地 方 存在 交叉 点 。 这 等 
价 于 先 对 两 个 多 项 式 函 数 作 差 , 然后 对 所 得 的 多 项 式 函 数 求 根 ,使 用 polysub 函 数 对 多 项 式 作 差 : 





poly_sub = np.polysub(poly_bhp, poly_vale) 
xpoints = np.roots (poly_sub) 
print "Intersection points", xpoints 


解 出 的 交叉 点 如 下 : 
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Intersection points [ 27.73321597+0.j 27.51284094+0 .j 24.32064343+0 .Jj 
18.86423973+0.j 12.43797190+1.73218179j 12.43797190-1.73218179j 
6.34613053+0.62519463j 6.34613053-0.62519463j] 


(6) 得 到 的 结果 为 复数 ， 这 不 利于 我 们 后 续 处 理 ， 除 非 时 间 也 有 实 部 和 虚 部 。 因 此 ， 这 里 需 
要 用 isreal 函 数 来 判断 数组 元 素 是 否 为 实数 : 


reals = np.isreal (xpoints) 
print "Real number?", reals 


结果 如 下 : 


Real number? [ True True True True False False False False] 


可 以 看 到 有 一 部 分 数据 为 实数 , 因此 我 们 用 select 函 数 选 出 它们 。select 函 数 可 以 根据 一 
组 给 定 的 条 件 ， 从 一 组 元 素 中 挑选 出 符合 条 件 的 元 素 并 返回 数组 : 





xpoints = np.select([reals], [xpoints]) 
Xpoints = xpoints.real 
print "Real intersection points", xpoints 


得 到 的 实数 交叉 点 如 下 所 示 : 


Real intersection points [ 27.73321597 27.51284094 24.32064343 18.86423973 
0. 0。 0。 0.] 


(7) 我 们 需要 去 掉 其 中 为 0 的 元 素 。trim_zeros 函 数 可 以 去 掉 一 维 数 组 中 开头 和 末尾 为 0 的 
元 素 : 
print "Sans 0s", np.trim zeros(xpoints) 


去 掉 0 元 素 后 ， 输 出 结果 如 下 所 示 : 


Sans 0s [ 27.73321597 27.51284094 24.32064343 18.86423973] 


刚才 做 了 些 什 么 


我 们 使 用 hanning 函 数 对 股票 收益 率 数 组 进行 了 平滑 处 理 , 使 用 polysub 函 数 对 两 个 多 项 式 
作 差 运算 ， 以 及 使 用 isreal 函 数 判断 数组 元 素 是 否 为 实数 ， 并 用 select 函 数 选 出 了 实数 元 素 。 
最 后 ， 我 们 用 trim_zeros 函 数 去 掉 数 组 首尾 的 0 元 素 。 示 例 代 人 码 见 smoothing.py 文 件 。 











import numpy as np 

import sys 

from matplotlib.pyplot import plot 
from matplotlib.pyplot import show 


N = int(sys.argv[1]) 


weights = np.hanning(N) 
print "Weights", weights 
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bhp = np.loadtxt ('BHP.csv', delimiter=',', usecols=(6,), unpack=True) 
bhp_returns = np.diff(bhp) / bhp[ : -1] 

smooth bhp = np.convolve (weights/weights.sum(), bhp_returns) [N-1: -N+1] 
vale = np.loadtxt ('VALE.csv', delimiter=',', usecols=(6,), un pack=True) 
vale _ returns = np.diff(vale) / vale[ : -1] 

smooth vale = np.convolve (weights/weights.sum(), vale returns) [N-1: -N+1] 


K = JInt (syes.argv[1]) 

t = np.arange(N - 1, lenl(bhp_returns)) 
poly_bhp = np.polyfit(t, smooth bhp, K) 
poly_vale = np.polyfit(t, smooth vale, K) 


poly_sub = np.polysub(poly_bhp, poly_vale) 
xpoints = np.roots (poly_sub) 
print "Intersection points", xpoints 





reals = np.isreal (xpoints) 
print "Real number?", reals 


xpoints = np.select([reals], [xpoints]) 
Xxpoints = xpoints.real 

print "Real intersection points", xpoints 
print "Sans 0s", np.trim zeros (xpoints) 


plot(t, bhp_returns[N-1:], lw=1.0) 
plot(t, smooth bhp, lw=2.0) 


plot(t, vale returns[N-1:], lw=1.0) 
plot(t, smooth vale, lw=2.0) 
Show() 


勇敢 出 发 ， 党 试 各 种 平滑 函数 





青 尝 试 使 用 其 他 的 平滑 函数 ， 如 hamming、blackman、bartlett 以 及 kaiser。 它 们 的 
使 用 方法 和 hanning 函 数 类 似 。 





4.11 ”本章 小 结 


在 本 章 中 ， 我们 使 用 corrcoef 水 数 计 算 了 两 只 股票 收益 率 的 相关 性 。 男 外 ， 我 们 还 顺便 学 
习 了 diagonal 和 trace 也 数 的 用 法 ， 分别 可 以 给 出 矩阵 的 对 角 线 元 素 和 和 矩 阵 的 迹 。 


我 们 使 用 polyfit 函 数 拟 合 一 系列 数据 点 , 用 polyval 函 数 计算 多 项 式 函 数 的 取 值 ，roots 
函数 求解 多 项 式 的 根 ， 以 及 polyaqer 国 数 求 解 多 项 式 函 数 的 导 函 数 。 


希望 通过 本 章 的 内 容 , 可 以 帮助 读者 提高 工作 效率 , 以 便 更 好 地 学 习 下 一 章 中 矩阵 和 通用 也 
数 ( ufuncs ) 的 相关 内 容 。 
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和 矩阵 和 通用 函数 








本 章 我 们 将 学 习 短 阵 和 通用 函数 ( universal functions， 即 ufuncs ) 的 相关 
内 容 。 矩 阵 作为 一 种 重要 的 数学 概念 ， 在 NumPy 中 也 有 专门 的 表示 方法 。 通 
用 函数 可 以 逐个 处 理 数组 中 的 元 素 ， 也 可 以 直接 处 理 标 量 。 通 用 函数 的 输入 
是 一 组 标量 ,输出 也 是 一 组 标量 ， 它 们 通常 可 以 对 应 于 基本 数学 运算 ， 如 加 、 
减 、 乘 、 除 等 。 我 们 还 将 介绍 三 角 函 数 、 位 运算 函数 和 比较 函数 。 





本 章 涵盖 以 下 内 容 : 


口 矩阵 创建 ; 
口 矩阵 运算 ; 

口 基本 通用 函数 ; 
口 三 角 函 数 ; 

口 位 运算 函数 ; 
口 比较 函数 。 





- 





5.1 和 矩阵 


在 NumPy 中 , 矩阵 是 ndarray 的 子 类 , 可 以 由 专用 的 字符 串 格式 来 创建 。 与 数学 概念 中 的 和 矩 
阵 一 样 , NumPy 中 的 矩阵 也 是 二 维 的 。 如 你 所 料 , 抢 阵 的 乘法 运算 和 NumPy 中 的 普通 乘法 运算 不 
同 。 徊 运算 当然 也 不 一 样 。 我 们 可 以 使 用 mat 、matzix 以 及 bmat 函 数 来 创建 和 矩 阵 。 








5.2 ”动手 实 践 : 创建 德 阵 


mat 函 数 创建 矩 阵 时 ， 若 输入 已 为 matrix 或 ndqaarray 对 象 ， 则 不 会 为 它们 创建 副本 。 因此 , 调 
用 mat 函 数 和 调用 matrix(data，copy=False) 等 价 。 我 们 还 将 展示 矩阵 转 置 和 矩阵 求 逆 的 方法 。 
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(1) 在 创建 算 阵 的 专用 字符 串 中 ， 和 矩阵 的 行 与 行 之 间 用 分 号 隔 开 ,行内 的 元 素 之 间 用 空格 隔 
开 。 使 用 如 下 的 字符 串 调用 mat 函 数 创建 矩阵 : 


A = np.mat('l1 2 3; 4 5 6; 7 8 9') 
print "Creation from string", A 


输出 的 矩阵 如 下 : 


Creation Erom string [[1 2 3] 
[4 5 6] 
[7 8 9]] 


(2) 用 T 属 性 获取 转 置 矩 阵 : 











print "transpose A", A.T 
转 置 矩 阵 如 下 : 


transpose A [[1 4 7] 
[2 5 8] 
[3 6 9]] 


(3) 用 I 属 性 获取 逆 矩 阵 : 

print "Inverse A", A.I 

求 得 的 道 和 矩阵 如 下 《注意 : 计算 复杂 度 为 0 (n3) ): 

Inverse A [[ -4.50359963e+15 9.00719925e+15 -4.50359963e+15] 
[ 9.00719925e+15 -1.80143985e+16 9.00719925e+15] 


[ -4.50359963e+15 9.00719925e+15 -4.50359963e+15]] 


(4) 除了 使 用 字符 串 创建 算 阵 以 外 ， 我 们 还 可 以 使 用 NumPy 数 组 进行 创 轨 











[由 





print "Creation from array", np.mat (np.arange(9) .reshape(3, 3)) 
创建 的 和 矩阵 如 下 : 
Creation from array [[0 1 2] 


[3 4 5] 
[6 7 8]] 


刚才 做 了 些 什么 


我 们 使 用 ma 函数 创 建 了 矩阵， 用 r 属 性 获取 了 转 置 矩阵 ， 用 I 属 性 获 了 到 了 逆 矩 阵 。 示 例 代码 
见 matrixcreation.py 文 件 。 














import numpy as np 


A= np.mat('1 2 3; 4 5 6; 7 89') 
print "Creation from string", A 


图 灵 社 区 会 员 heruihong 专 享 尊重 版 权 





88 第 5 章 上 短 阵 和 通用 函数 





print "transpose A", A.T 
print "Inverse A", A.I 
print "Check Inverse", A * A.I 


print "Creation from array", 


5.3 ”从 已 有 算 阵 创建 新 和 矩阵 
有 些 时 候 ， 我 们 希望 利用 一 些 已 有 的 较 小 的 矩阵 来 创建 一 个 新 的 大 矩阵。 这 可 以 用 bmat 函 


数 来 实现 。 这 里 的 bp 表 示 “ 分 块 ”， 





np.mat (np.arange (9) .reshape(3, 


bmat 即 分 块 和 矩阵 (block matrix )。 


5.4 动手 实践 : 从 已 有 德 阵 创 建新 矩阵 


我 们 将 利用 两 个 较 小 的 矩阵 创建 一 个 新 的 和 矩阵， 步骤 如 下 。 


(1) 首先 ， 创 建 一 个 2x2 的 单位 矩阵 : 


A = np.eye(2) 


print "A", 


该 单位 矩阵 如 下 所 示 : 


A I[[ 1. 0. 


[ 0. 1.]] 


] 





创建 男 一 个 与 A 同型 的 和 矩阵， 并 乘 以 2: 


B= 2 * A 
BPEnE BV; 


第 二 个 矩阵 如 下 所 示 : 


(2) 使 用 字符 虽 





阵 变 量 名 代替 数字 : 
print "Compound matrix\n", np.bmat ("A B; A 


创建 的 复合 矩阵 如 下 所 示 : 


Compound matri 


r 
0 
。2 
0 
2 


创建 复合 矩阵 ， 该 字符 串 的 格式 与 mat 函 数 中 一 致 ， 


x 
] 
] 
] 
] 


] 
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在 这 里 你 可 以 月 





日 矩 
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刚才 做 了 些 什么 


我 们 使 用 pbmat 函 数 ， 从 两 个 小 矩阵 创建 了 一 个 分 块 复合 矩阵 。 我 们 用 和 矩阵 变量 名 替代 了 数 
并 将 字符 串 传 给 bmat 函 数 。 示 例 代 码 见 bmatcreation.py 文 件 。 





直 





import numpy as np 


A = np.eye(2) 

print "A", A 

瑟 = 2 # 及 

Brint: "BE" B 

print "Compound matrix\n", np.bmat ("A B; A B") 


突击 测验 : 使 用 字符 串 定 义 矩 阵 
问题 1 在 使 用 mat 和 bmat 函 数 创 建 答 阵 时 ， 需 要 和 输入 字符 串 来 定义 矩阵 。 在 字符 串 中 ， 


以 下 哪 一 个 英文 标点 符号 是 矩阵 的 行 分 隔 符 ? 
(1) 分 号 Se 


(3) 各 号 We 
(4) 空格 “” 





5.5 通用 函数 


通用 函数 的 输入 是 一 组 标量 , 输出 也 是 一 组 标量 , 它们 通常 可 以 对 应 于 基本 数学 运算 , 如 加 、 























5.6 ”动手 实践 : 创建 通用 函数 
我 们 可 以 使 用 Numpy 中 的 frompyfunc 函 数 , 通过 一 个 Python 函数 来 创建 通用 函数 , 步 又 如 下 。 


(1) 定义 一 个 回答 宇宙 、 生 命 及 万 物 的 终极 问题 的 Python 函数 〈 问题 和 答案 来 源 于 《银河 系 
漫游 指南 》 如 果 你 没 看 过 ， 可 以 忽略 ): 




















def ultimate answer (al) : 


到 这 里 为 止 还 没有 什么 特别 的 。 我 们 将 这 个 函数 命名 为 ultimate_answer， 并 为 之 定义 了 
一 个 参数 a。 








(2) 使 用 zeros_like 国 数 创 建 一 个 和 a 形 状 相 同 ， 并 且 元 素 全 部 为 0 的 数组 result: 





result = np.zeros_like(a) 
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(3) 现在 ， 我 们 将 刚刚 生成 的 数组 中 的 所 有 元 素 设置 为 “终极 答案 ”其 值 为 42， 并 返回 这 个 
结果 。 完 整 的 函数 代码 如 下 所 示 。f1at 属 性 为 我 们 提供 了 一 个 扁平 迭代 器 ， 可 以 逐个 设置 数组 
元 素 的 值 : 


def ultimate answer (a): 
result = np.zeros_like(a) 
result.flat = 42 
return result 


(4) 使 用 frompyfunc 创 建 通用 也 数 。 指定 输入 参数 的 个 数 为 1， 随 后 的 1 为 输出 参数 的 个 数 : 


ufunc = np.frompyfunc (ultimate answer, 1, 1) 
print "The answer", ufunc (np.arange (4)) 


输出 结果 如 下 所 示 : 

The answer [42 42 42 42] 

我 们 可 以 对 二 维 数组 进行 完全 一 样 的 操作 ， 代 码 如 下 : 
print "The answer", ufunc (np.arange(4) .reshape (2, 2)) 
输出 结果 如 下 所 示 : 


The answer [[42 42] 
[[42 42] 
[42 42]] 

















刚才 做 了 些 什么 


我 们 定义 了 一 个 Python 函数 。 其 中 ， 我 们 使 用 zeros_1ike 函 数 根据 输入 参数 的 形状 初始 化 
一 个 全 为 0 的 数组 ， 然 后 利用 naqarray 对 象 的 ELat 属 性 将 所 有 的 数组 元 素 设 置 为 “终极 答案 ”其 
值 为 42。 示 例 代码 见 answer42.py 文 件 。 








import numpy as np 

def ultimate answer (a): 
result = np.zeros_like(a) 
result.flat = 42 


return result 


ufunc = np.frompyfunc (ultimate answer, 1, 1) 
print "The answer", ufunc (np.arange (4)) 





print "The answer", ufunc (np.arange(4) .reshape(2, 2)) 


5.7 ”通用 函数 的 方法 
函数 竟然 也 可 以 拥有 方法 ? 如 前 所 述 , 其 实 通用 函数 并 非 真正 的 函数 , 而 是 能 够 表示 函数 的 
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对 象 。 通 用 函数 有 四 个 方法 ,不 过 这 些 方法 只 对 输入 两 个 参数 、 输 出 一 个 参数 的 ufunc 对 象 有 效 ， 
例如 aaqa 函 数 。 其 他 不 符合 条 件 的 ufunc 对 象 调用 这 些 方法 时 将 抛 出 ValueError 异 常 。 因 此 只 能 
在 二 元 通用 函数 上 调用 这 些 方 法 。 以 下 将 逐一 介绍 这 4 个 方法 : 


口 reduce 
D accumulate 


D reduceat 





口 outer 


5.8 动手 实践 : 在 aaa 上 调用 通用 函数 的 方法 
我 们 将 在 aad 函 数 上 分 别 调用 4 个 方法 。 


(1) 沿 着 指定 的 轴 ， 在 连续 的 数组 元 素 之 间 递 归 调 用 通用 函数 ， 即 可 得 到 输入 数组 的 规约 
( reduce ) 计算 结果 。 对 于 add 函数 ， 其 对 数组 的 reduce 计 算 结 果 等 价 于 对 数组 元 素 求 和 。 调 用 
reduce 方 法 : 





a = np.arange(9) 
print "Reduce'", np.add.reduce(a) 


计算 结果 如 下 : 
Reduce 36 
(2) accumulate 方 法 同样 可 以 递归 作用 于 输入 数组 。 但 是 与 requce 方 法 不 同 的 是 ， 它 将 存 


储 运 算 的 中 间 结 果 并 返回 。 因 此 在 aqq 函 数 上 调用 accumulate 方 法 ， 等 价 于 直接 调用 cumsum 函 
数 。 在 adqq 函 数 上 调用 accumulate 方 法 : 


























print "Accumulate", np.add.accumulate(a) 
计算 结果 如 下 : 
Accumulate [ 013610 15 21 28 36] 


(3) reduceat 方 法 解释 起 来 有 点 复杂 ， 我 们 先 运行 一 次 ， 表 一 步 一 步 来 看 它 的 算法 。 
reduceat 方 法 需要 输入 一 个 数组 以 及 一 个 索引 值 列 表 作为 参数 。 





print "Reduceat", np.add.reduceat(a, [0, 5, 2, 7]) 


运行 结果 如 下 : 





Reduceat [10 5 20 15] 


第 一 步 用 到 索引 值 列 表 中 的 0 和 5， 实 际 上 就 是 对 数组 中 索引 值 在 0 到 5 之 间 的 元 素 进行 reduce 
操作 。 
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print "Reduceat step I", np.add.reduce(a[0:5]) 

第 一 步 的 输出 如 下 : 

Reduceat step I 10 

第 二 步 用 到 索引 值 3 和 2。 由 于 2 比 5 小 ， 所 以 直接 返回 索引 值 为 5 的 元 素 : 

print "Reduceat step II"，a[5] 

第 二 步 的 结果 如 下 : 

Reduceat step II 5 

第 三 步 用 到 索引 值 2 和 7。 这 一 步 是 对 索引 值 在 2 到 7 之 间 的 数组 元 素 进行 reduce 操 作 : 
print "Reduceat step III", np.add.reduce(a[2:7]) 

第 三 步 的 结果 如 下 : 

Reduceat step III 20 

第 四 步 用 到 索引 值 7。 这 一 步 是 对 索引 值 从 7 开始 直到 数组 末端 的 元 素 进行 reduce 操 作 : 
print "Reduceat step IV", np.add.reduce(a[7:]) 

第 四 步 的 结果 如 下 : 

Reduceat step IV 15 


(4) outer 方 法 返回 一 个 数组 , 它 的 秩 ( rank ) 等 于 两 个 输入 数组 的 秩 的 和 。 它 会 作用 于 两 个 
输入 数组 之 间 存 在 的 所 有 元 素 对 。 在 add 隐 数 上 调用 outer 方 法 : 






































print "Outer", np.add.outer (np.arange(3), a) 


输出 结果 如 下 : 

Outer [[ 01234567 8] 
[1234567 8 9] 
[23456789 10]] 

刚才 做 了 些 什么 

















我 们 在 通用 函数 aqadq 上 调用 了 四 个 方法 : reduce、accumulate、reduceat 以 及 outer。 
示例 代码 见 ufuncmethods.py 文 件 。 








import numpy as np 
a = np.arange(9) 


print "Reduce", np.add.reduce(a) 
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print "Accumulate", np.add.accumulate(a) 

print "Reduceat", np.add.reduceat(a, [0, 5, 2, 7]) 
print "Reduceat step I", np.add.reduce(a[0:5]) 
print "Reduceat step II"，a[5] 

print "Reduceat step III", np.add.reduce(a[2:7]) 
print "Reduceat step IV", np.add.reduce(a[7:]) 
print "Outer", np.add.outer (np.arange(3), a) 


5.9 算术 运算 


在 NumPy 中 ， 基 本 算术 运算 符 +、- 和 * 隐 式 关联 着 通用 函数 add、subtract 和 multiply。 
也 就 是 说 ， 1 法 人 六 后 符 时 ,对 应 的 通用 函数 将 自动 被 调用 。 除 法 包含 
的 过 程 则 较为 复杂 ， 在 数组 的 除法 运算 中 涉及 三 个 通用 孙 数 divide 、true_gdivide 和 
floor_division, 以 及 两 个 对 应 的 运 云 算 符 /和 //。 



























































5.10 ”动手 实践 : 数组 的 除法 运算 5 
让 我 们 在 实践 中 了 解数 组 的 除法 运算 。 
(1) aivide 函 数 在 整数 和 浮 点 数 除法 中 均 只 保留 整数 部 分 : 


总 = Darray([2, 6, Sl])} 
Db: =p array([li, 2 .3]) 
print "Divide", np.divide(a, b), np.divide(b, a) 


divide 国 数 的 运算 结果 如 下 : 
Divide [2 3 1] [0 0 0] 


如 你 所 见 ， 运 算 结果 的 小 数 部 分 被 截断 了 。 
(2) true_qdivide 函 数 与 数学 中 的 除法 定义 更 为 接近 ， 即 返回 除法 的 浮 点 数 结果 而 不 作 截 断 : 


print "True Divide", np.true divide(a, b), np.true divide(b, a) 
true_diviade 国 数 的 运算 结果 如 下 : 


True Divide [2. 3 。 1.66666667] [0.5 
0.33333333 0.6 ] 


(3) £1loor_qdivigde 也 数 总 是 返回 整数 结果 ， 相 当 于 先 调用 divige 也 数 再 调用 f1oor 限 数 。 
floor 也 数 将 对 浮 点 数 进行 向 下 取 整 并 返回 整数 . 


print "Floor Divide", np.floor divide(a, b), np.floor divide(b, a) c = 3.14 * b 
print "Floor Divide 2", np.floor- divide(e, b), np.floor divide(b, ©&) 


floor_divide 国 数 的 运算 结果 如 下 : 
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Floor Divide [2 3 1] [0 0 0] 
Floor Divide 2 [ 3. 3. 3.] [ 0. 0. 0.] 


(4) 默认 情况 下 ， 使 用 /运算 符 相 当 于 调用 aiviae 函 数 : 
from future import division 


但 如 果 在 Python 程 序 的 开头 有 上 面 那 名 代码 ， 则 改 为 调用 true_qivigde 函 数 。 代 码 如 下 : 























print "/ operator", a/b, b/a 




















计算 结果 如 下 : 
/ operator [ 2. 3。 1.66666667] [ 0.5 
0.33333333 0.6 ] 


(5) 运算 符 / /对 应 于 floor_divide 隙 数 。 例 如 下 面 的 代码 : 


print "// operator", a//b, b//a 
print "// operator 2", c//b, b//c 


计算 结果 如 下 : 


// operator [2 3 1] [0 0 0] 
// operator 2 [ 3. 3. 3.] [ 0. 0. 0.] 














刚才 做 了 些 什 么 


我 们 学 习 了 NumPy 中 三 种 不 同 的 除法 孔 数 。 其 中 ，gdiviqe 函 数 在 整数 和 浮 点 数 除法 中 均 只 
保留 整数 部 分 , true_dqivide 国 数 不 作 截断 返回 浮 点 数 结果 , 而 Eloor_dqiviae 国 数 同样 返回 整 
数 结果 并 等 价 于 先 调用 aiviae 函 数 再 调用 floozr 了 六 数 。 示 例 代 码 见 dividing.py 文 件 。 





也 





























from future import division 
import numpy as np 


a = np.array([2, 6, 5]) 
b = np.array ([1, 2, 3]) 


print "Divide", np.divide(a, b), np.divide(b, a) 

print "True Divide", np.true divide(a, b), np.true divide(b, a) 
print "Floor Divide", np.floor divide(a, b), np.floor divide(b, a) 
G4 * 

print "Floor Divide 2", np.floor divide(c, b), np.floor divide(b, c) 
print "/ operator", a/b, b/a 

print "// operator", a//b, b//a 

DELNnt "/y/ ODErator os 


勇敢 出 发 : 尝试 _future .division 





动手 实验 ， 验 证 引入 future .division 的 效果 。 
| 
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5.11 模 运 算 


计算 模 数 或 者 余数 ， 可 以 使 用 NumPy 中 的 mod、remainder 和 fmod 了 水 数 。 当 然 ， 也 可 以 使 
用 % 运 算 符 。 这 些 函 数 的 主要 差异 在 于 人 处理 负数 的 方式 。fmod 函 数 在 这 方面 异 于 其 他 函数 。 





5.12 ”动手 实践 : 模 运 算 
我 们 将 逐一 调用 前 面 提 到 的 函数 。 


(1) remainder 子 数 逐 个 返回 两 个 数组 中 元 素 相 除 后 的 余数 。 如 果 第 二 个 数字 为 0， 则 直接 
返回 0: 





a = np.arange(-4, 4) 
print "Remainder", np.remainder (a, 2) 


计算 结果 如 下 : 
Remainder [0 1010101] 


(2) mod 困 数 与 remaindqer 国 数 的 功能 完全 一 致 ; 








print "Mod", np.mod(a, 2) 
计算 结果 如 下 : 
Mod [0 1010101] 


(3) $8 操作 符 仅 仅 是 remainder 也 数 的 简写 : 





print "多 operator", a % 2 
计算 结果 如 下 : 
% operator [0 1010101] 


(4) fmoda 函 数 处 理 负数 的 方式 与 remainder 、modq 和 % 不 同 。 所 得 余数 的 正 负 由 被 除数 决定 ， 
与 除数 的 正 负 无 关 : 


print "Fmod", np.fmod(a, 2) 
计算 结果 如 下 : 


Fmod [0-10-10101] 








刚才 做 了 些 什么 


我 们 学 习 了 NumPy 中 的 mod、remainder 和 fmod 等 模 运 算 孔 数 。 示例 代码 见 modulo.py 文 件 。 
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import numpy as np 


a = np.arange(-4, 4) 


print "Remainder", np.remainder (a, 2) 


print "Mod", np.mod(a, 2) 
print "% operator", a % 2 
print "Fmod", np.fmod(a, 2) 


5.13” 疾 波 那 契 数列 


斐 波 那 契 (Fibonacci ) 数列 是 基于 递 推 关系 生成 的 。 直接 用 NumPy 代 码 来 解释 递 推 关系 是 比 
较 麻 烦 的 ， 不 过 我 们 可 以 用 算 阵 的 形式 或 者 黄金 分 割 公式 来 解释 它 。 因 此 ， 我 们 将 介绍 matrix 
和 rint 消 数 。 使 用 matrix 消 数 创建 矩阵 ，rint 函 数 对 浮 点 数 取 整 ， 但 结果 仍 为 浮 点 数 类 型 。 





5.14 动手 实践 : 计算 斐 











波 那 契 数列 


斐 波 那 契 数 列 的 递 推 关系 可 以 用 矩阵 来 表示 。 斐 波 那 契 数 列 的 计算 等 价 于 矩阵 的 连 乘 。 


(1) 创建 斐 波 那 契 矩阵 ; 








F = np.matrix([[1，1]，[1，0]]) 


eh 本 可 





创建 的 斐 波 那 契 矩 阵 如 下 所 示 : 


F [[1 1] 
[1 0]] 


(2) 计算 斐 波 那 契 数列 中 的 第 8 个 数 ,， 即 矩阵 的 才 为 8 减 去 1。 计 算出 的 斐 波 那 契 数 位 于 矩阵 的 


对 角 线 上 : 





print "8th Fibonacci", (F ** 7)[0, 0] 


输出 的 第 8 个 斐 波 那 契 数 为 : 


8th Fibonacci 21 


(3) 利用 黄金 分 割 公 式 或 通常 所 说 的 比 奈 公式 ( Binet? s Formula )， 加 上 取 整 函数 ， 就 可 以 直 











接 计 算 斐 波 那 契 数 。 计 算 前 8 个 斐 波 那 契 数 : 


n = np.arange(1，9) 

Sarts = np.8art (Ss) 

Bhi = (1 + Sqrt5) /2 
fibonacci = np.rint( (phi**n 


- (-1/phi)**n)/sqrt5) 


print "Fibonacci", fibonacci 





输出 的 斐 波 那 契 数 为 : 


图 灵 社 区 会 员 


heruihong 专 享 尊重 版 权 





5.16 动手 实践 : 绘制 利 萨 药 曲线 97 





Fibonacci [ Ls = 2 3。 5。 8. 13. 21.] 


刚才 做 了 些 什 么 


我 们 分 别 用 两 种 方法 计算 了 韭 波 那 问 数列 。 在 这 个 过 程 中 ， 我 们 学 习 使 用 matrix 隐 数 创建 
和 矩 了 泗 ， 以 及 使 用 rint 函 数 对 浮 点 数 取 整 但 不 改变 浮 点 数 类 型 。 示 例 代 码 见 fibonacci.py 文 件 。 








import numpy as np 


EF = Dunaterx( [lly 1]. El; OT]Y 
nh RE 吾 
print "8th Fibonacci", (F ** 7)[0, 0] 


n = np.arange(1, 9) 


sqrt5 = np.sqart(5) 


phi = (1 + sqrt5)/2 
fibonacci = np.rint((phi**n - (-1/phi)**n)/sqrts5) 
print "Fibonacci", fibonacci 





勇敢 出 发 : 分 析 计 算 耗 时 


你 可 能 很 想 知道 究竟 哪 种 方法 计算 更 快 ， 那 就 分 析 一 下 它们 的 耗 时 吧 。 使 用 frompyfunc 
创建 一 个 计算 斐 波 那 契 数 列 的 通用 函数 ， 并 进行 计时 。 





5.15 ” 利 萨 站 曲线 


在 NumPy 中 ， 所 有 的 标准 三 角 函 数 如 sin 、cos 、tan 等 均 有 对 应 的 通用 函数 。 利 萨 站 曲线 
(Lissajous curve ) 是 一 种 很 有 趣 的 使 用 三 角 消 数 的 方式 。 我 至 今 仍 记得 在 物理 实验 室 的 示 波 絮 上 
显示 出 利 萨 茹 曲线 时 的 情景 。 利 萨 茹 曲线 由 以 下 参数 方程 定义 : 









































A sin(lat + n/2) 
再 Birn( Bt 


x 
y 


5.16 ”动手 实践 : 绘制 利 萨 站 曲线 
利 艾 茹 曲线 的 参数 包括 A、B、a 和 b。 为 简单 起 见 ， 我 们 令 A 和 B 均 为 1。 
(1) 使 用 1inspace 函 数 初始 化 变量 t， 即 从 -pi 到 pi 上 均匀 分 布 的 201 个 点 : 





a = float(sys.argv[1]) 
b = float(sys.argv[2]) 
t = np.linspace(-np.pi, np.pi, 201) 


(2) 使 用 sin 函 数 和 NumPy 常 量 pi 计 算 变 量 x: 
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XxX = np.sin(a * t + np.pi/2) 
(3) 使 用 sin 函 数 计算 变量 y: 
YY =. nD. Sin(bD. * ty} 


(4) 我 们 将 在 第 9 章 中 详细 讲解 Matplot1ib 的 用 法 。 绘 制 的 曲线 如 下 所 示 。 








Re a 




















< 











plot (x, y) 
show () 


这 里 设置 的 参数 为 a=9，b=8。 


刚才 做 了 些 什么 


我 们 根据 参数 方程 的 定义 ,以 参数 A=B=1、a=9 和 pb=8 绘 制 了 利 萨 茹 曲线 。 我 们 还 使 用 了 sin 
和 1inspace 限 数 ， 以 及 NumPy 常 量 pi。 示 例 代码 见 lissajous.py 文 件 。 


import numpy as np 

from matplotlib.pyplot import plot 
from matplotlib.pyplot import show 
import sys 


二 二 float (eve,.argvl1])}) 

b= float(sys.argvl2]) 

t = np.linspace(-np.pi, np.pi, 201) 
x = np.sin(a * t + np.pi/2) 

v= nD sin(b * Et) 

Blot (x Y) 

Show() 
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5.17 方 波 
方 波 也 是 一 种 可 以 在 示波器 上 显示 的 波形 。 方 波 可 以 近似 表示 为 多 个 正弦 波 的 到 加 。 事 实 上 ， 
任意 一 个 方 波 信和 号 都 可 以 用 无 穷 傅 里 叶 级 数 来 表示 。 


倩 里 时 级 数 (Fourier series ) 是 以 正弦 函 数 和 余 纺 函数 为 基 函 数 的 无 穷 级 数 ， 
一 以 著名 的 法 国 数学 家 Jean-Baptiste Fourier 命 名 。 


方 波 可 以 表示 为 如 下 的 傅 里 叶 级 数 。 


~ 4sin((2k- 1)1) 
多 (2k- 1)n 














5.18 ”动手 实践 : 绘制 方 波 = 


与 前 面 的 教程 中 一 样 ， 我 们 仍 将 以 相同 的 方式 初始 化 tc 和 k。 我 们 需要 累加 很 多 项 级 数 ， 且 
级 数 越 多 结果 越 精 确 ， 这 里 取 k=99 以 保证 足够 的 精度 。 绘 制 方 波 的 步 又 如 下 。 


(1) 我 们 从 初始 化 t 和 k 开 始 ， 并 将 函数 值 初始 化 为 0: 








np.linspace(-np.pi, np.pi, 201) 
np.arange(1, float(sys.argv[1])) 
2*k-1 


必 
k 
k 
f np.zeros_like(t) 


(2) 接 下 来 ， 直 接 使 用 sin 和 sum 消 数 进 行 计算 : 
for i in range(len(t)): 

£[i] = np.Sum(np.Sin(k * t[il)/k) 
f= (4/ np.pi) * f 


(3) 绘制 波形 的 代码 和 前 面 的 教程 中 几乎 一 模 一 样 : 


plLOt(t。 二 ) 
Show() 





采用 k=99 绘 制 出 的 方 波 曲线 如 下 所 示 。 


刚才 做 了 些 什么 
我 们 使 用 sin 函 数 生成 了 一 个 方 波 , 或 者 起 码 是 非常 接近 于 方 波 的 波形 。 函 数 的 输入 值 是 用 
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1inspace 产 生 的 ， 而 一 组 k 值 是 用 arange 函 数 生 成 的 。 示 例 代 码 见 squarewave.py 文 件 。 





CM 





1.0F 





-1.0 上 一 














一 1.5. 











import numpy as np 

from matplotlib.pyplot import plot 
from matplotlib.pyplot import show 
import sys 


np.linspace(-np.pi, np.pi, 201) 
np.arange(1, float(sys.argv[1])) 
和 R= 1 

np.zeros_like(t) 


mo 


村 。 相 “ 瑟 ， 末 


for i in range(len(t)): 


所 [二 ] = eum(npD.. einm(kK * 在 TAR 
f= (4/ np.pi) * f 
Blot(t, FE£} 
show () 


勇敢 出 发 :摆脱 循环 语句 


你 可 能 已 经 注意 到 ， 在 代码 中 有 一 个 循环 语 自 。 使 用 NumPy 函 数 摆脱 循环 ， 并 确保 你 的 代 
码 性 能 因此 而 得 到 提升 。 





5.19 锯齿 波 和 三 角 波 


在 示 波 需 上 , 锯齿 波 和 三 角 波 也 是 常见 的 波形 。 和 方 波 类 似 , 我 们 也 可 以 将 它们 表示 成 无 穷 
侍 里 叶 级 数 。 对 锯齿 波 取 绝 对 值 即 可 得 到 三 角 波 。 锯 齿 波 的 无 穷 级 数 表达 式 如 下 : 
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~ — 2sin(2nk1) 


kT 








5.20 ”动手 实践 : 绘制 锯齿 波 和 三 角 波 
与 前 面 的 教程 中 一 样 ， 我 们 仍 将 以 相同 的 方式 初始 化 t: 和 k。 同 样 ， 取 k=99 以 保证 足够 的 精 


度 。 绘 制 锯齿 波 和 三 角 波 的 步骤 如 下 。 
(1) 将 函数 值 初始 化 为 0: 
t = np.linspace(-ny.pi, np.pi, 201) 
k = np.arange(1, float(sys.argv[1])) 
E = np.zeros_like(t) 


(2) 同样 ， 直 接 使 用 sin 和 和 sum 函数 进行 计算 : 


for i in range(len(t)): 


£1li] = psum(npSin(2 * nipi * k* tC[il)/k) 


E = (-2 / np.pi) * 于 








(3) 同时 绘制 锯齿 波 和 三 角 波 并 不 难 , 因为 三 角 波 函数 的 取 值 恰好 是 锯齿 波 函 数值 的 绝对 值 。 





使 用 如 下 代码 绘制 波形 : 


Blot(t,;, EE; Tw=1,0) 
plot(t; np.abs(f)}, lw=2.0) 
Show() 


在 下 图 中 ， 较 粗 的 曲线 为 三 角 波 。 








二 


0.5r 














-1.5. 
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刚才 做 了 些 什么 


我 们 使 用 sin 函 数 绘制 了 锯齿 波 。 函 数 的 输入 值 是 用 linspace 产 生 的 ， 而 一 组 k 值 是 用 
arange 际 数 生成 的 。 三 角 波 则 是 对 锯齿 波 取 绝 对 值得 到 的 。 示 例 代 码 见 sawtooth.py 文 件 。 








import numpy as np 

from matplotlib.pyplot import plot 
from matplotlib.pyplot import show 
import sys 


= np.linspace(-np.pi, np.pi, 201) 
k = np.arange(1, float (sys.argv[1])) 


np.zZeros_like(t) 


for i in range(len(t)): 


f[i] = np.sum(np.sin(2 * np.pi * k * t[i])/k) 
f = (-2 / np.pi) * f£ 
plot(t, f, lw=1.0) 
plot(t, np.abs(f), lw=2.0) 
show () 


勇敢 出 发 : 摆脱 循环 语句 


愿意 接受 挑战 ， 摆 脱 代 码 中 的 循环 语句 ? 使 用 NumPy 函 数 应 该 可 以 完成 这 个 任务 ， 
生 能 可 以 翻 倍 。 





5.21 位 操作 函数 和 比较 函数 














a ni 了 了 操作， 它们 都 是 通用 函数 。 、| 、<<、>> 
等 位 操作 符 在 NumPy 中 也 有 对 应 的 部 分 ， 符 也 是 如 此 。 和 了 条 
你 可 以 在 代码 中 殉 _- 些 高 级 技巧 以 提升 代码 的 性 能 。 不 过 ,它们 会 使 代码 变 得 难以 理解 ， 因 此 需 

谨慎 使 用 。 


5.22 ”动手 实践 : 玩 转 二 进 制 位 


我 们 将 学 习 三 个 小 技巧 一 一 检查 两 个 整数 的 符号 是 否 一 致 ， 检 查 一 个 数 是 否 为 2 的 客 数 ， 以 
及 计算 一 个 数 被 2 的 需 数 整除 后 的 余数 。 我 们 会 分 别 展 示 两 种 方法 ， 即 使 用 位 操作 符 和 使 用 相应 
的 NumPy 函 数 。 


(1) 第 一 个 小 技巧 需要 用 xoR 或 者 ^ 操 作 符 。xoR 操 作 符 又 被 称 为 不 等 运算 符 ， 因 此 当 两 个 操 
作 数 的 符号 不 一 致 时 ，xoR 操 作 的 结果 为 负数 。 在 NumPy 中 ，“^ 操 作 符 对 应 于 bitwise_xor 峭 数 ， 
< 操作 符 对 应 于 less 卫 数 。 
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x = np.arange(-9, 9) 


y = -x 
print "Sign different?", (x ^y) < 0 

print "Sign different?", np.less (np.bitwise xor(x, y), 0) 
结果 如 下 : 


Sign different? [ True True True True True True True True True False True True True 
True True True True True] 
Sign different? [ True True True True True True True True True False True True True 
True True True True True] 


不 出 所 料 ， 除 了 都 等 于 0 的 情况 ， 所 有 整数 对 的 符号 均 相 异 。 


(2) 在 二 进 制 数 中 ，2 的 寡 数 表示 为 一 个 1 后 面 跟 一 串 0 的 形式 ， 例 如 10、100、1000 等 。 而 比 
2 的 寡 数 小 1 的 数 表示 为 一 串 二 进 制 的 1， 例 如 11、111、1111 ( 即 十 进 制 里 的 93、7、15 ) 等 。 如 
果 我 们 在 2 的 震 数 以 及 比 它 小 1 的 数 之 间 执 行 位 与 操作 AND， 那么 应 该 得 到 0。 在 NumPy 中 ，g 操 作 
符 对 应 于 bitwise_andq 函 数 ，== 操 作 符 对 应 于 eaual1 函 数 。 











print "Power of 2?\n", x, "\n", (x & (Xx- 1)) == 
print "Power of 2?\n", x, "\n'", np.equal (np.bitwise and(x, (x - 1)), 0) 
结果 如 下 : 


Power of 2? 

[-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8] 
[False False False False False False False False False True True 
True 

False True False False False True] 

Power of 2? 

[-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8] 
[False False False False False False False False False True True 
True 

False True False False False True] 


(3) 计算 余数 的 技巧 实际 上 只 在 模 为 2 的 窜 数 ( 如 4、8、16 等 ) 时 有 效 。 二 进 制 的 位 左 移 一 位 ， 
则 数值 翻 倍 。 在 前 一 个 小 技巧 中 我 们 看 到 ， 将 2 的 徊 数 减 去 1 可 以 得 到 一 串 1 组 成 的 二 进 制 数 ， 如 
11、111、1111 等 。 这 为 我 们 提供 了 掩 码 ( mask )， 与 这 样 的 掩 码 做 位 与 操作 AND 即 可 得 到 以 2 
的 宕 数 作为 模 的 余数 。 在 NumPy 中 ，<< 操 作 符 对 应 于 1eft_shift 末 数 。 








print "Modulus 4\n", x, "\n", x & ((1 << 2) - 1) 

print "Modulus 4\n", x, "\n", np.bitwise and(x, np.left_ shift(1, 2) - 1) 
结果 如 下 : 

Modulus 4 


[-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8] 
[3 0 1 2 3 0 1 2 3 0 1 2 3 0 1 2 3 0] 

Modulus 4 

[-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8] 
[3 0 1 2 3 0 1 2 3 0 1 2 3 0 1 2 3 0] 
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刚才 做 了 些 什么 


我 们 学 习 了 三 个 运用 位 操作 的 小 技巧 一 一 检查 两 个 整数 的 符号 是 否 一 致 , 检查 一 个 数 是 否 为 
2 的 寡 数 ， 以 及 计算 一 个 数 被 2 的 震 数 整除 后 的 余数 。 我 们 看 到 了 NumPy 中 对 应 于 ^、&、<<、< 等 
操作 符 的 通用 函数 。 示 例 代码 见 bittwiddling.py 文 件 。 











import numpy as np 


x = np.arange(-9, 9) 


print "Sign different?", (x ^y) < 0 

print "Sign different?", np.less(np.bitwise xor(x, y), 0) 

print "Power of 2?\n", x, "\n", (x & (x - 1)) == 0 

print "Power of 2?\n", x, "\n", np.equal (np.bitwise and(x, (x - 1)), 0) 
print "Modulus 4\n", x, "\n", x & ((1 << 2) - 1) 

print "Modulus 4\n", x, "\n'", np.bitwise and(x, np.left _ shift(1, 2) - 1) 


5.23 本章 小 结 


在 本 章 中 , 我 们 学 习 了 NumPy 中 的 和 矩阵 和 通用 函数 , 包括 如 何 创建 矩阵 以 及 通用 函数 的 工作 
方式 。 我 们 还 简单 介绍 了 算术 运算 函数 、 三 角 函 数 、 位 操作 函数 和 比较 函数 等 通用 函数 。 


下 一 章 中 ， 我们 将 开始 学 习 NumPy 模 块 的 相关 内 容 。 
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第 6 章 


深入 学 习 NumPy 模 块 








NumPy 中 有 很 多 模块 是 从 它 的 前 身 Numeric 继 承 下 来 的 。 这 些 模块 有 一 
部 分 在 SciPy 中 也 有 对 应 的 部 分 ， 并 且 功能 可 能 更 加 丰富 ， 我 们 将 在 后 续 章 节 
中 讨论 相关 内 容 。 numpy .dual 模 块 包 含 同时 在 NumPy 和 SciPy 中 定义 的 函数 。 
在 本 章 中 讨论 的 模块 也 属于 numpy .dual 的 一 部 分 。 


本 章 洱 盖 以 下 内 容 ; 

口 1inalg 模 块 ; 

口 Eft 模 块 ; 

口 随机 数 ; 

口 连续 分 布 和 离散 分 布 。 











6.1 线性 代数 

线性 代数 是 数学 的 一 个 重要 分 支 , numpy .1inalg 模 块 包含 线性 代数 的 函数 ,使 用 这 个 模块 ， 
我 们 可 以 计算 逆 和 矩阵 、 求 特征 值 、 解 线性 方程 组 以 及 求解 行列 式 等 。 
6.2 ”动手 实践 : 计算 逆 和 矩阵 


在 线性 代数 中 , 矩阵 4 与 其 逆 矩 阵 4: 相 乘 后 会 得 到 一 个 单位 矩阵 万 该 定义 可 以 写 为 4*4 =1。 
numpy.1inalg 模 块 中 的 inv 函 数 可 以 计算 道 矩 阵 。 我 们 按 如 下 步骤 来 对 和 矩阵 求 道 。 
(1) 与 前 面 的 教程 中 一 样 ， 我 们 将 使 用 mat 函 数 创 建 示例 矩阵 : 


A= np.mat("0 1 2;1 0 3;4 -3 8") 
print "A\n", A 
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输出 的 矩阵 4 如 下 所 示 : 
A 
[[ 0 1 2] 
[1 0 3] 
[ 4 -3 8]] 


(2) 现在 ， 我 们 使 用 inv 函 数 计算 逆 和 矩阵 : 


inverse = np.linalg.inv (A) 


print "inverse of A\n", inverse 


输出 的 逆 和 矩阵 如 下 : 


inverse of A 


[[-4.5 7. -1.5] 
[-2. 4. -1. ] 
[ 1.5 -2. 0.5]] 


如 果 输 入 适 阵 是 奇异 的 或 非 方 阵 ”， 
作为 练习 留 给 读者 ， 如 果 你 愿意 ， 可 以 动手 党 


六 


G) 我 们 来 检查 一 下 原 矩 阵 和 求 得 


"Check\n", 


的 逆 和 矩阵 相 乘 的 结 





print A * inverse 


不 出 所 料 ， 结 果 确实 是 一 个 单位 矩阵 : 





Check 
[[ 1. 0 0.] 
[ 0. 1 0.] 
[ 0. 0 1.]] 
刚才 做 了 些 什么 


我 们 使 用 numpy. Linalg 模 块 中 的 inv 函 数 计算 了 逆 矩 阵 ， 


则 会 抛 出 LinAlgError 异 常 
ss 试 一 下 。 


。 我 们 将 此 


并 检查 了 原 和 矩阵 与 求 得 的 道 矩 阵 











相 乘 的 结果 确 为 单位 矩阵。 示例 代码 见 inversion.py 文 件 。 





import numpy as np 


A= np.mat("0 1 2;1 0 3;4 -3 8") 
print "A\n", A 


inverse = np.linalg.inv (A) 


print "inverse of A\n", inverse 








Q@ 奇异 矩阵 即行 列 式 等 于 0 的 矩阵 。 方 阵 即行 数 与 列 数 一 样 多 的 矩阵 。 
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print "CheckNn"，A * inverse 


突击 测验 : 如 何 创 建 矩 阵 


问题 1 以 下 哪个 函数 可 以 创建 答 阵 ? 
(1) array 

(2) create _ matrix 

(3) mat 

(4) vector 


勇敢 出 发 : 创建 新 矩阵 并 计算 其 逆 和 矩阵 





请 自行 创建 一 个 新 的 矩阵 并 计算 其 送 矩 阵 。 注 意 ， 你 的 矩阵 必须 是 方 阵 且 可 送 ， 否 则 会 抛 
出 LinRALgError 异 常 。 





6.3 求解 线性 方程 组 


和 矩阵 可 以 对 向 量 进行 线性 变换 ， 这 对 应 于 数学 中 的 线性 方程 组 。numpy.1Linalg 中 的 函数 
solve 可 以 求解 形 如 4x =。 的 线性 方程 组 ， 其 中 4 为 矩阵 ，2 为 一 维 或 二 维 的 数组 ，x 是 未 知 变 
量 。 我 们 将 练习 使 用 aot 函 数 ， 用 于 计算 两 个 浮 点 数 数组 的 点 积 。 














6.4 动手 实践 : 求解 线性 方程 组 
让 我 们 求解 一 个 线性 方程 组 实例 ， 步 又 如 下 。 
(1) 创建 矩阵 A 和 数组 pb: 
A= np.mat("1 -2 1;0 2 -8;-4 5 9") 
print. "ANn™; -A 


b = np.array ([0, 8, -9]) 
和 下 于 看 长 了 EN 改 











和 矩阵 A 和 数组 p 如 下 所 示 : 
A 
CE 1 ~ 4] 
CO ZzZ -8] 
C-4 5S 9]3] 
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(2) 调用 solve 函 数 求解 线性 方程 组 : 


x = np.linalg.solve(A, b) 
PEINt “SoluUtion™, 


求解 结果 如 下 : 


Solution [ 29. 


Xx 


16. 3.] 


(3) 使 用 got 隐 数 检查 求 得 的 解 是 否 正确 : 





print 
结果 和 预期 的 一 致 : 


Check 
[[ 0. 


"Check\n", np.dot(A , x) 


8. -9.]] 


刚才 做 了 些 什 么 


我 们 使 用 NumPy 的 1inalg 模 块 中 的 solve 函 


解 的 正确 性 。 示 例 代码 见 solution.py 文 件 。 


import numpy as np 


A= np.mat("1 -2 1;0 2 -8;-4 5 9") 


print "A\n", A 

b = np.array([0, 8, -9]) 

Bint 了 所 NO 也 

x = np.linalg.solve(A, b) 
print "Solution", x 

print "Check\n", np.dot (A , x) 


6.5 ”特征 值 和 特征 向 量 


特征 值 ( eigenvalue ) 即 方程 4x = ax 的 根 ， 
个 一 维 向 量 。 特 征 向 量 (eigenvector ) 是 关于 特 和 
函数 可 以 计算 矩阵 的 特征 值 ， 而 sig 函 数 可 以 返 























6.6 





数 求解 了 线性 方程 组 ,并 使 用 dot 函数 验证 了 求 
































是 一 个 标量 。 其 中 ，4 是 一 个 二 维和 矩阵 ,x 是 一 
FE 值 的 向 量 。 在 numpy .1inalg 模 块 中 , eigvals 
回 一 个 包含 特征 值 和 对 应 的 特征 向 量 的 元 组 。 





动手 实践 : 求解 特征 值 和 特征 向 量 


我 们 来 计算 矩阵 的 特征 值 和 特征 向 量 ， 步 又 如 下 。 
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(1) 创建 一 个 矩阵 : 


A= np.mat("3 -2;1 0") 
print "A\n", A 


创建 的 矩阵 如 下 所 示 : 
A 

[[ 3 -2] 

[1 0]1 


(2) 调用 sigvals 函 数 求 解 特征 值 : 





print "Eigenvalues", np.linalg.eigvals (A) 
求 得 的 特征 值 如 下 : 
Eigenvalues [ 2. 1.] 


(3) 使 用 eig 函 数 求解 特征 值 和 特征 向 量 。 该 函数 将 返回 一 个 元 组 ， 按 列 排 放 着 特征 值 和 对 
应 的 特征 向 量 ， 其 中 第 一 列 为 特征 值 ， 第 二 列 为 特征 向 量 。 

















eigenvalues, eigenvectors = np.linalg.eig(A) 
print "First tuple of eig", eigenvalues 
print "Second tuple of eig\n", eigenvectors 


求 得 的 特征 值 和 特征 向 量 如 下 所 示 : 





First tuple of eig [ 2. 1.] 
Second tuple of eig 

[[ 0.89442719 0.70710678] 

[ 0.4472136 0.70710678]] 


(4) 使 用 aot 函 数 验 证 求 得 的 解 是 否 正确 。 分 别 计算 等 式 ax = ax 的 左 半 部 分 和 右 半 部 分 ， 
检查 是 否 相等 。 


for i in range(len(eigenvalues)): 
print "Left", np.dot(A, eigenvectors[:,i]) 
print "Right", eigenvalues[i] * eigenvectors[:,i] 
print 


输出 结果 如 下 : 


Left [[ 1.78885438] 
[ 0.89442719]] 

Right [[ 1.78885438] 
[ 0.89442719]] 

Left [[ 0.70710678] 
[ 0.70710678]] 

Right [[ 0.70710678] 
[ 0.70710678]] 
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刚才 做 了 些 什 么 


我 们 使 用 numpy .1inalg 模 块 中 的 eigvals 和 eig 函 数 求解 了 和 矩阵 的 特征 值 和 特征 向 量 ， 并 
使 用 aot 函 数 进行 了 验证 。 示 例 代码 见 eigenvalues.py 文 件 。 














import numpy as np 


A= np.mat("3 -2;1 0") 
print "A\n", A 


print "Eigenvalues", np.linalg.eigvals (A) 


eigenvalues, eigenvectors = np.linalg.eig (A) 
print "First tuple of eig", eigenvalues 
print "Second tuple of eig\n", eigenvectors 


for i in range(len(eigenvalues)): 
print "Left", np.dot(A, eigenvectors[:,1i]) 
print "Right", eigenvalues[i] * eigenvectors[:,1i] 
洽 六 主攻 


6.7 ”奇异 值 分 解 


SVD (Singular Value Decomposition， 奇 异 值 分 解 ) 是 一 种 因子 分 解 运算 ， 将 一 个 矩阵 分 解 
为 3 个 矩阵 的 乘积 。 奇 异 值 分 解 是 前 面 讨论 过 的 特征 值 分 解 的 一 种 推广 。 在 numpy.1Iinalg 模 块 
中 的 svq 函 数 可 以 对 矩阵 进行 奇异 值 分 解 。 该 函数 返回 3 个 矩阵 一 一 V、Sigma 和 六 其 中 和 1 哩 
正 交 甜 阵 ，Sigma 包 含 输入 矩阵 的 奇异 值 。 


M = UzZV 


星 号 表示 厄 米 共 恩 (Hermitian conjugate ) 或 共 斩 转 置 ( conjugate transpose )。 
































6.8 动手 实践 : 分 解 和 矩阵 
现在 ， 我 们 来 对 矩阵 进行 奇异 值 分 解 ， 步 骤 如 下 。 
(D 首先 ， 创 建 一 个 矩阵 ; 


A= np.mat("4 11 14;8 7 -2") 
print "A\n", A 


创建 的 矩阵 如 下 所 示 : 
A 


[[ 4 11 14] 
[87 -2]] 
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(2) 使 用 sva 函 数 分 解 和 矩阵 : 

U, Sigma, V = np.linalg.svd(A, full matrices=False) 
Brint "UU" 

print U 


print "Sigma" 
print Sigma 


peint. TY 

print V 

得 到 的 结果 包含 等 式 中 左右 两 端的 两 个 正 交 和 矩阵 UV 和 VF， 以 及 中 间 的 奇异 值 矩 阵 Sigma: 
TU 


[[-0.9486833 -0.31622777] 

[-0.31622777 0.9486833 ]] 

Sigma 

[ 18.97366596 9.48683298] 

Vv 

[[-0.33333333 -0.66666667 -0.66666667] 
[ 0.66666667 0.33333333 -0.66666667]] 


(3) 不 过 ， 我 们 并 没有 真正 得 到 中 间 的 奇异 值 矩 阵 一 一 得 到 的 只 是 其 对 角 线 上 的 值 ， 而 非 对 
角 线 上 的 值 均 为 0。 我 们 可 以 使 用 aiag 函 数 生成 完整 的 奇异 值 矩 阵 。 将 分 解 出 的 3 个 矩阵 相 乘 ， 
如 下 所 示 : 


print "Product\n", U * np.diag (Sigma) * V GE 


相 乘 的 结果 如 下 : 
Product 
EE 远 :。 竹下 二 < 下 和 


[2 


刚才 做 了 些 什么 


我 们 分 解 了 一 个 矩阵， 并 使 用 矩阵 乘法 验证 了 分 解 的 结果 。 我 们 使 用 了 NumpPy 1inalg 模 块 
中 的 sva 函 数 。 示 例 代码 见 decomposition.py 文 件 。 








import numpy as np 


A= np.mat("4 11 14;8 7 -2") 
print "A\n", A 


U, Sigma, V = np.linalg.svd(A, full matrices=False) 


print "U" 
print U 


print "Sigma" 
print Sigma 
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六 这 二 坟 世 这 六 
print V 


print "Product\n", U * np.diag(Sigma) * V 


6.9 广义 逆 和 矩阵 


摩尔 彭 罗 斯 广义 道 和 矩阵 (Moore-Penrose pseudoinverse ) 可 以 使 用 numpy .1inalg 模 块 中 的 
pinv 函 数 进行 求解 (广义 道 矩 阵 的 具体 定义 请 访问 http://en.wikipedia.org/wikiMoore%E2%80%- 
93Penrose_pseudoinverse )。 计 算 广 义 逆 矩阵 需要 用 到 奇异 值 分 解 。inv 函 数 只 接受 方 阵 作 为 输入 
和 矩阵， 而 pinv 函 数 则 没有 这 个 限制 。 




















6.10 动手 实践 : 计算 广义 逆 和 矩阵 
我 们 来 计算 矩阵 的 广义 逆 和 矩阵 ， 步 又 如 下 。 
(1) 首先 ， 创 建 一 个 矩阵: 


和 = np.mat("4 11 14;8 7 -2") 
print "A\n", A 


创建 的 矩阵 如 下 所 示 : 


A 
[[ 4 11 14] 
[87 -2]] 


(2) 使 用 pinv 函 数 计算 广义 逆 矩 阵 : 


pseudoinv = np.linalg.pinv (A) 
print "Pseudo inverse\n", pseudoinv 


计算 结果 如 下 : 


Pseudo inverse 
[[-0.00555556 0.07222222] 
[ 0.02222222 0.04444444] 
[ 0.05555556 -0.05555556]] 


(3) 将 原 和 矩阵 和 得 到 的 广义 逆 和 矩阵 相 乘 : 





print "Check", A * pseudoinv 
得 到 的 结果 并 非 严格 意义 上 的 单位 矩阵 ， 但 非常 近似 ， 如 下 所 示 : 


Check [[ 1.00000000e+00 0.00000000e+00] 
[ 8.32667268e-17 1.00000000e+00]] 
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刚才 做 了 些 什么 


我 们 使 用 numpy .1inalg 模 块 中 的 pinv 函 数 计算 了 和 矩阵 的 广义 逆 矩 阵 。 在 验证 时 ， 用 原 矩 
阵 与 广义 道 矩 阵 相 乘 ， 得 到 的 结果 为 一 个 近似 单位 矩阵 。 示 例 代 码 见 pseudoinversion.py 文 件 。 


import numpy as np 


A= np.mat("4 11 14;8 7 -2") 
print "AND; “A 


pseudoinv = np.linalg.pinv (A) 
print "Pseudo inverse\n", pseudoinv 


print "Check", A * pseudoinv 


6.11 行列 式 


行列 式 ( determinant ) 是 与 方 阵 相关 的 一 个 标量 值 ， 在 数学 中 得 到 广泛 应 用 (更 详细 的 介 
绍 请 访问 http://en.wikipedia.org/wiki/Determinant )。 对 于 一 个 nxn 的 实数 和 矩阵, 行列 式 描述 的 是 
一 个 线性 变换 对 “有 向 体积 ”所 造成 的 有 影响。 行列 式 的 值 为 正 表 示 保 持 了 空间 的 定向 ( 顺 时 针 
或 逆 时 针 ), 为 负 则 表示 凑 倒 了 空间 的 定向 。numpy.1inalg 模 块 中 的 aet 郴 数 可 以 计算 矩阵 的 
行列 式 。 

















6.12 ”动手 实践 : 计算 矩阵 的 行列 式 
计算 矩阵 的 行列 式 ， 步 又 如 下 。 
(1) 创建 一 个 矩阵 : 


A= np.mat("3 4;5 6") 
peint TANNT, A 


创建 的 矩阵 如 下 所 示 : 





print "Determinant"，np.1inalg.dqet(A) 


计算 结果 如 下 : 





Determinant -2.0 
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刚才 做 了 些 什么 


我 们 使 用 numpy. Linalg 模 块 中 的 aet 函 数 计算 了 和 矩阵 的 行列 式 。 示 例 代码 见 determinantpy 
文件 。 





import numpy as np 


A= np.mat("3 4;5 6") 
print "A\n", A 


print "Determinant", np.linalg.det (A) 


6.13 快速 传 里 叶 变 换 


FFT ( Fast Fourier Transform ， 快 速 傅 里 叶 变 换 ) 是 一 种 高 效 的 计算 DFT ( Discrete Fourier 
Transform ， 离 散 传 里 叶 变 换 ) 的 算法 。FFT 算 法 比 根 据 定义 直接 计算 更 快 ， 计 算 复杂 度 为 
O(WlogN) 。DFT 在 信号 处 理 、 图 像 处 理 、 求 解 偏 微分 方程 等 方面 都 有 应 用 。 在 NumPy 中 ， 有 一 
个 名 为 Eft 的 模块 提供 了 快速 傅 里 叶 变 换 的 功能 。 在 这 个 模块 中 ,许多 函数 都 是 成 对 存在 的 ， 也 
就 是 说 许多 函数 存在 对 应 的 逆 操 作 函 数 。 例 如 ，£fft 和 ifft 函 数 就 是 其 中 的 一 对 。 




















6.14 动手 实践 : 计算 傅 里 叶 变 换 
首先 ， 我 们 将 创建 一 个 信号 用 于 变换 。 计 算 侍 里 叶 变 换 的 步骤 如 下 。 
(1) 创建 一 个 包含 30 个 点 的 余弦 波 信和 号， 如 下 所 示 : 


x = np.linspace(0, 2 * np.pi, 30) 
wave = np.cos (x) 


(2) 使 用 Eft 函 数 对 余弦 波 信 号 进行 伟 里 叶 变 换 。 





transformed = np.fft.fft (wave) 
(3) 对 变换 后 的 结果 应 用 ifft 函 数 ， 应 该 可 以 近似 地 还 原初 始 信和 号。 
print np.all(np.abs (np.fft.ifft(transformed) - wave) < 10 xx -9) 
结果 如 下 : 

True 


(4) 使 用 Matplot1ib 绘 制 变换 后 的 信号 。 





plot (transformed) 
Show() 
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绘制 的 结果 展示 了 傅 里 叶 变换 后 的 波形 。 


























刚才 做 了 些 什么 


我 们 在 余弦 波 信号 上 应 用 了 fft 函 数 , 随后 又 对 变换 结果 应 用 ifft 函 数 还 原 了 信号 。 示 例 代 
人 码 见 fourier.py 文 件 。 








import numpy as np 
from matplotlib.pyplot import plot, show 


X= np.linspace(0, 2 * np.pi, 30) 
wave = np.cos (x) 


transformed = np.fft.fft (wave) 
print np.all (np.abs (np.fft.ifft(transformed) - wave) < 10 ** -9) 


plot (transformed) 
Show() 


6.15 ” 移 频 


numpy.1inalg 模 块 中 的 Ettshift 国 数 可 以 将 FFT 输 出 中 的 直流 分 量 移动 到 频谱 的 中 央 。 
ifftshift 了 水 数 则 是 其 道 操作 。 
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6.16 动手 实践 : 移 频 
我 们 将 创建 一 个 信号 用 于 变换 ， 然 后 进行 移 频 操 作 ， 步 又 如 下 。 
(1) 创建 一 个 包含 30 个 点 的 余弦 波 信和 号 。 


X = np.linspace(0, 2 * np.pi, 30) 
wave = np.cos (x) 


(2) 使 用 fft 函 数 对 余弦 波 信号 进行 傅 里 叶 变 换 。 

transformed = np.fft.fft (wave) 

(3) 使 用 fftshift 函 数 进行 移 频 操作 。 

shifted = mnp.fftt.ffttshiftt(transformed) 

(4) 用 ifftshift 函 数 进行 逆 操 作 ， 这 将 还 原 移 频 操作 前 的 信号 。 

print np.all( (np.fft.ifftshift(shifted) - transformed) < 10 xx -9) 
结果 如 下 : 

True 

(5) 使 用 Matplot1ib 分 别 绘制 变换 和 移 频 处 理 后 的 信号 。 

plot (transformed, lw=2) 


plot (shifted, lw=3) 
Show() 


绘制 的 结果 展示 了 傅 里 叶 变 换 后 再 做 移 频 操作 的 波形 。 
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刚才 做 了 些 什么 


我 们 在 傅 里 时 变换 后 的 余弦 波 信 和 号 上 应 用 了 fftshift 函 数 ， 随 后 又 应 用 ifftshift 函 数 还 
原 了 信和 号。 示例 代码 见 fouriershift py 文件 。 





import numpy as np 
from matplotlib.pyplot import plot, show 


X= np.linspace(0, 2 * np.pi,; 30) 

wave = np.cos (x) 

transformed = np.fft.fft (wave) 

shifted = np.fft.fftshift(transformed) 

print np.all (np.abs (np.fft.ifftshift(shifted) - transformed) < 10 ** -9) 


plot(transformed, lw=2) 
plot(shifted, lw=3) 
Show() 


6.17 ”随机 数 


随机 数 在 蒙特 卡 鸭 方法 (Monto Carlo method )、 随 机 积分 等 很 多 方面 都 有 应 用 。 真 随机 数 的 
产生 很 困难 ,因此 在 实际 应 用 中 我 们 通常 使 用 伪 随 机 数 。 在 大 部 分 应 用 场景 下 ,， 伪 随机 数 已 经 足 
够 随机 ， 当 然 一 些 特殊 应 用 除外 。 有 关 随 机 数 的 函数 可 以 在 NumPy 的 random 模 块 中 找到 。 随 机 
数 发 生 器 的 核心 算法 是 基于 马 特 赛 特 旋转 演算 法 (Mersenne Twister algorithm ) 的 。 随 机 数 可 以 
从 离散 分 布 或 连续 分 布 中 产生 。 分 布 函数 有 一 个 可 选 的 参数 size， 用 于 指定 需要 产生 的 随机 数 
的 数量 。 该 参数 允许 设置 为 一 个 整数 或 元 组 ,生成 的 随机 数 将 填 满 指定 形状 的 数组 。 支 持 的 离散 
分 布 包括 几何 分 布 、 超 几何 分 布 和 二 项 分 布 等 。 











6.18 动手 实践 : 硬币 赌博 游戏 

二 项 分 布 是 zx 个 独立 重复 的 是 / 非 试验 中 成 功 次 数 的 离散 概率 分 布 ， 这 些 概率 是 固定 不 变 的 ， 
与 试验 结果 无 关 。 

设想 你 来 到 了 一 个 17 世 纪 的 赌场 , 正在 对 一 个 人 硬币 赌博 游戏 下 8 份 赌注 ,每 一 轮 抛 9 枚 硬币 ， 
如 果 少 于 5 枚 人 硬币 正面 朝 上 ， 你 将 损失 8 份 赌注 中 的 1 份 ; 否则 ,你 将 赢得 1 份 赌注 。 我 们 来 模拟 
一 下 赌博 的 过 程 ， 初 始 资 本 为 1000 份 赌注 。 为 此 ， 我 们 需要 使 用 random 模 块 中 的 binomial 

为 了 理解 binomial 函 数 的 用 法 ， 请 完成 如 下 步骤。 

(1) 初始 化 一 个 全 0 的 数组 来 存放 剩余 资本 。 以 参数 10000 调 用 binomial 函 数 ， 意 味 着 我 们 
将 在 赌场 中 玩 10 000 轮 硬币 赌博 游戏 。 
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cash = np.zeros(10000) 
cash[0] = 1000 
outcome = np.random.binomial(9, 0.5, size=len (cash)) 


(2) 模拟 每 一 轮 抛 硬币 的 结果 并 更 新 cash 数 组 。 打 印 出 cutcome 的 最 小 值 和 最 大 值 ， 以 检查 
输出 中 是 否 有 任何 异常 值 : 


for i in range(l1l, lenl(cash)): 
[了 








if outcome[i] < 5: 
cash[i] cash[i - 1] -1 
elif outcome[i] < 10: 
cash[i] = cash[i - 1] + 1 
else: 
raise AssertionError("Unexpected outcome " + outcome) 
print outcome.min(), outcome.max() 
不 出 所 料 ， 所 有 的 结果 值 都 在 0~9 之 间 : 
0 9 
(3) 使 用 Matplotlib 绘 制 cash 数 组 : 
plot (np.arange (len(cash)), cash) 
Show() 


从 下 图 中 可 以 看 到 ,我们 的 剩余 资本 呈 随 机 游 走 (random walk ) 状态 。 
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刚才 做 了 些 什么 


我 们 使 用 NumPy random 模 块 中 的 binomial 函 数 模 拟 了 随机 游 走 。 示 例 代 码 见 headortail.py 
文件 。 
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import numpy as np 
from matplotlib.pyplot import plot, Show 


cash = np.zeros(10000) 
cash[0] = 1000 


outcome = np.random.binomial(9, 0.5, size=len (cash)) 


for i in range(1l, len(cash)): 
[于 


if outcome[i] < 5: 
cash[i] cash[i - 1] - 1 
elif outcome[i] < 10: 
cash[i] = cash[i - 1] + 1 
else: 
raise AssertionError("Unexpected outcome " + outcome) 
print outcome .min()，outcome .max() 
plot(np.arange (len(cash)), cash) 


Show() 


6.19” 超 几何 分 布 


超 几 何 分 布 (hypergeometric distribution ) 是 一 种 离散 概率 分 布 ， 它 描述 的 是 一 个 饶 子 里 有 
两 种 物件 ， 无 放 回 地 从 中 抽取 指定 数量 的 物件 后 ， 抽 出 指定 种 类 物件 的 数量 。NumPy random 模 
块 中 的 hypergeometric 函 数 可 以 模拟 这 种 分 布 。 





6.20 动手 实践 : 模拟 游戏 秀 节目 


设想 有 这 样 一 个 游戏 秀 节 目 ， 每 当 参 赛 者 回答 对 一 个 问题 ， 他 们 可 以 从 一 个 钢 子 里 摸 出 3 个 
球 并 放 回 。 钢 子 里 有 一 个 “ 倒 考 球 ”, 一 旦 这 个 球 被 摸 出 ,参赛 者 会 被 扣 去 6 分 。 而 如 果 他 们 摸 出 
的 3 个 球 全 部 来 自 其 余 的 25 个 普通 球 ， 那 么 可 以 得 到 1 分 。 因 此 ， 如 果 一 共有 100 道 问题 被 正确 回 
答 ， 得 分 情况 会 是 怎样 的 呢 ? 为 了 解决 这 个 问题 ， 请 完成 如 下 步 又 。 


(1) 使 用 nypergeometric 也 数 初始 化 游戏 的 结果 矩阵。 该 函数 的 第 一 个 参数 为 钠 中 普通 球 
的 数量 ， 第 二 个 参数 为 “倒霉 球 ” 的 数量 ， 第 三 个 参数 为 每 次 采样 〈 摸 球 ) 的 数量 。 





























points = np.zeros(100) 
outcomes = np.random.hypergeometric(25, 1, 3, size=len (points)) 


(2) 根据 上 一 步 产生 的 游戏 结果 计算 相应 的 得 分 。 


for i in range(len(points)): 
if outcomes[i] == 





points[i] = points[i - 1] + 1 
elif outcomes[i] == 2: 
points[i] = points[i - 1] - 6 
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else: 
print outcomes[i] 


(3) 使 用 Matplot1ib 绘 制 points 数 组 。 





plot (np.arange (len(points)), points) 
Show() 


下 图 展示 了 得 分 的 变化 情况 。 





30 


























刚才 做 了 些 什么 


我 们 使 用 NumPy random 模 块 中 的 hypergeometric 国 数 模 拟 了 一 个 游戏 秀 节目 。 这 个 游戏 
的 得 分 取决 于 每 一 轮 从 饶 子 里 摸 出 的 球 的 种 类 。 示 例 代 码 见 urn.py 文 件 。 


import numpy as np 
from matplotlib.pyplot import plot, show 





points = np.zeros(100) 
outcomes = np.random.hypergeometric(25, 1, 3, size=len(points)) 


for i in range(len(points)): 
if outcomes[i] == 
[ 


points[i 
elif outcomes[i] == 2: 

points[i points[i - 1] - 6 
else: 


print outcomes[i] 








plot (np.arange (len(points)), points) 
Show() 
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6.21 连续 分 布 


连续 分 布 可 以 用 PDF ( Probability Density Function， 概 率 密度 函数 ) 来 描述 。 随 机 变量 落 在 某 
一 区 间 内 的 概率 等 于 概率 密度 函数 在 该 区 间 的 曲线 下 方 的 面积 。NumPy 的 random 模 块 中 有 一 系列 
连续 分 布 的 函数 


， ， ， 日 9 A 
logistic、 multivariate normal、 noncentral chisquare、noncentral _f、normal 等 。 





beta、chisquare .exponential.f .gamma .gumbel .laplace.lognormal.、 


6.22 ”动手 实践 : 绘制 正 态 分 布 

随机 数 可 以 从 正 态 分 布 中 产生 , 它们 的 直方 图 能 够 直观 地 刻画 正 态 分 布 。 按 照 如 下 步骤 绘制 
正 态 分 布 Le] 

(1) 使 用 NumPy random 模 块 中 的 normal 函 数 产生 指定 数量 的 随机 数 。 


N=10000 
normal values = np.random.normal (size=N) 


(C) 绘制 分 布 直 方 图 和 理论 上 的 概率 密度 函数 (均值 为 0、 方 差 为 1 的 正 态 分 布 ) 曲线 。 我 们 
将 使 用 Matplotlib 进 行 绘图 。 




















dummy, bins, dummy = plt.hist(normal values, np.sqrt(N), normed=True, lw=1) 
sigma = 1 


mu = 0 

plt.plot (bins, 1/(sigma * np.sqrt(2 * np.pi)) * np.exp( - (bins -mu)**2 / (2 * 
sigma**2) ),1lw=2) 

plt.show!() 


从 下 图 中 ， 我 们 可 以 看 到 熟悉 的 钟 形 曲 线 。 
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刚才 做 了 些 什么 


我 们 画 出 了 NumPy random 模 块 中 的 normal 郴 数 模拟 的 正 态 分 布 。 我 们 将 该 函数 生成 的 
随机 数 绘制 成 分 布 直方 图 ， 并 同时 绘制 了 标准 正 态 分 布 的 钟 形 曲线 。 示 例 代码 见 normaldist.py 
文件 。 


import numpy as np 
import matplotlib.pyplot as plt 








N=10000 


normal_values = np.random.normal (size=N) 
dummy, bins, dummy = plt.hist(normal_ values, np.sqrt(N), normed=True, lw=1) 
sigma = 1 


mu = 0 

plt.plot (bins, 1/(sigma * np.SGrt(2 * np.pi)) * np.exp( - (bins -mu)**2 / (2 * 
sigma**2) ),1lw=2) 

plt.show!() 


6.23 ”对 数 正 态 分 布 


对 数 正 态 分 布 (lognormal distribution ) 是 自然 对 数 服 从 正 态 分 布 的 任意 随机 变量 的 概率 分 
布 。NumPy random 模 块 中 的 1ognormal 国 数 模拟 了 这 个 分 布 。 


6.24 ”动手 实践 : 绘制 对 数 正 态 分 布 
我 们 绘制 出 对 数 正 态 分 布 的 概率 密度 函数 以 及 对 应 的 分 布 直方 图 ， 步 又 如 下 。 
(1) 使 用 NumPy random 模 块 中 的 normal 函 数 产 生 随机 数 。 


N=10000 
lognormal_values = np.random.lognormal (size=N) 


CO) 绘制 分 布 直方 图 和 理论 上 的 概率 密度 函数 ( 均值 为 0、 方 差 为 1 )。 我 们 将 使 用 Matplotlib 进 
J 绘图 。 


dummy, bins, dummy = plt.hist(lognormal values,np.sqrt(N), normed=True, lw=1) 
sigma = 1 

mu = 0 

x = np.linspace(min(bins), max(bins), len(bins)) 

pdf = np.exp(- (numpy.log(x) - mu)**2 / (2 * sigma**2))/ (x *sigma * np.sqrt(2 * np.pi)) 
Blt,plot (x varf,lw=3) 

plt.show!() 


如 你 所 见 ， 直 方 图 和 理论 概率 密度 函数 的 曲线 吻合 得 很 好 。 
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刚才 做 了 些 什么 


我 们 画 出 了 NumPy random 模 块 中 的 1ognormal 也 数 模 拟 的 对 数 正 态 分 布 。 我 们 将 该 函数 生 
成 的 随机 数 绘制 成 分 布 直方 图 ， 并 同时 绘制 了 理论 上 的 概率 密度 画 数 曲线 。 示 例 代码 见 GB 
lognormaldist.py 文 件 。 








import numpy as np 
import matplotlib.pyplot as plt 


N=10000 

lognormal values = np.random.lognormal (size=N) 

dummy, bins, dummy = plt.hist(lognormal values, np.sqrt(N),normed=True, lw=1) 
sigma = 1 

mu = 0 

x = np.linspace(min(bins), max(bins), len(bins)) 

pdf = np.exp(-(np.log(x) - mu)**2 / (2 * sigma**2))/ (x * sigma * np.sqrt(2 * np.pi)) 
Dlt ,plot(xw, pat, lw=3) 

plt.show!() 


6.25 ”本 章 小 结 

在 本 章 中 , 我 们 学 习 了 很 多 NumPy 模 块 的 知识 ,涵盖 了 线性 代数 、 人 快速 傅 里 叶 变 换 、 连 续 分 
布 和 离散 分 布 以 及 随机 数 等 内 容 。 

在 下 一 章 中 , 我 们 将 学 习 一 些 专用 函数 。 这 些 函 数 可 能 不 会 经 常用 到 , 但 当 你 需要 时 会 非常 
有 用 。 
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作为 NumPy 用 户 ， 我 们 有 时 会 发 现 自己 在 金融 计算 或 信号 处 理 方面 有 一 
些 特殊 的 需求 。 幸 运 的 是 ，NumPy 能 满足 我 们 的 大 部 分 需求 。 本 章 将 讲述 
NumPy 中 的 部 分 专用 函数 。 


本 章 涵 盖 以 下 内 容 : 
口 排序 和 搜索 ; 

口 特殊 函数 ; 

口 金融 函数 ; 

口 窗口 函数 。 








7.1 排序 
NumPy 提 供 了 多 种 排序 函数 ， 如 下 所 示 : 


口 sort 函 数 返回 排序 后 的 数组 ; 

口 lexsort 消 数 根 据 键 值 的 字典 序 进行 排序 ; 

口 argsort 消 数 返 回 输 入 数组 排序 后 的 下 标 ; 

口 ndarray 类 的 sort 方 法 可 对 数组 进行 原 地 排序 ; 

口 msort 函 数 沿 着 第 一 个 轴 排 序 ; 

口 sort_complex 国 数 对 复数 按照 先 实 部 后 虚 部 的 顺序 进行 排序 。 


在 上 面 的 列表 中 ，argsort 和 sort 了 水 数 可 用 来 对 NumPy 数 组 类 型 进行 排序 。 











7.2 动手 实践 : 按 字典 序 排序 
NumPy 中 的 lexsort 消 数 返回 输入 数组 按 字典 序 排序 后 的 下 标 。 我 们 需要 给 lexsort 消 数 提 
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供 排序 所 依据 的 键 值 数组 或 元 组 。 步 又 如 下 。 


(1) 回顾 一 下 第 3 章 中 我 们 使 用 的 AAPL 股 价 数据 ， 现 在 我 们 要 将 这 
全 不 同 的 地 方 。 我 们 将 载 和 人 收盘 价 和 日 期 数据 。 是 的 ， 处 理 日 期 总 是 
门 的 转换 函数 。 


些 很 久 以 前 的 数据 用 在 完 
很 复杂 ,我 们 为 其 准备 了 专 











def datestr2num(s): 
return datetime.datetime.strptime (s, "%d-%m-%Y") .toordinal () 


dates,closes=np.loadtxt ('AAPL.csv', delimiter=',', 
usecols=(1,6), converters={l1:datestr2num}, unpack=True) 


(2) 使 用 1exsort 函 数 排序 。 数 据 本 身 已 经 按照 日 期 排序 ， 不 过 我 们 现在 优先 按照 收盘 价 
排序 : 


indices = np.lexsort((dates, closes)) 





print "Indices", indices 
print ["%s %s" % (datetime.date.fromordinal (dates[i]), closes[i]) for i in indices] 
输出 结果 如 下 : 


['2011-01-28 336.1', '2011-02-22 338.61', '2011-01-31 339.32', 
'2011-02-23 342.62', '2011-02-24 342.88', '2011-02-03 343.44', 
"2011-02-02 344.32', '2011-02-01 345.03', '2011-02-04 346.5', 

'2011-03-10 346.67', '2011-02-25 348.16', '2011-03-01 349.31', 
"2011-02-18 350.56', '2011-02-07 351.88', '2011-03-11 351.99', 
"2011-03-02 352.12', '2011-03-09 352.47', '2011-02-28 353.21', 
"2011-02-10 354.54', '2011-02-08 355.2', '2011-03-07 355.36', 

"2011-03-08 355.76', '2011-02-11 356.85', '2011-02-09 358.16', 
'2011-02-17 358.3', '2011-02-14 359.18', '2011-03-03 359.56', 
"2011-02-15 359.9', '2011-03-04 360.0', '2011-02-16 363.13'] 


刚才 做 了 些 什么 


我 们 使 用 NumPy 中 的 1exsort 函 数 对 AAPL 的 收盘 价 数据 进行 了 排序 。 该 函数 返回 了 排序 后 
的 数组 下 标 。 示 例 代 码 见 lex.py 文 件 。 


import numpy as np 
import datetime 
def datestr2num(s): 
return datetime.datetime.strptime(s, "%®d-%m-%Y") .toordinal () 


dates,closes=np.loadtxt('AAPL.csv', delimiter=',', usecols=(1, 6), 
converters={1:datestr2num}, unpack=True) 
indices = np.lexsort( (dates, closes)) 


print "Indices", indices 
print ["%s %s" % (datetime.date.fromordinal (int (dates[i])), 
closes[i]) for i in indices] 


图 灵 社 区 会 员 heruihong 专 享 尊 


由 





版 权 











勇敢 出 发 ， 尝试 不 同 的 排序 次 序 


我 们 按照 收盘 价 和 日 期 的 顺序 进行 了 排序 。 请 尝试 不 同 的 排序 次 序 。 使 用 我 们 在 上 一 章 中 


学 习 的 random 模 块 生成 随机 数 并 用 lexsort 对 它们 进行 排序 。 





7.3 复数 


复数 包含 实数 部 分 和 虚数 部 分 。 如 同 在 前 面 的 章节 中 提 到 的 ，NumPy 中 有 专门 的 复数 类 型 ， 











按照 先 实 部 后 虚 部 的 顺序 排序 。 





7.4 动手 实践 : 对 复数 进行 排序 
我 们 将 创建 一 个 复数 数组 并 进行 排序 ， 步 又 如 下 。 





使 用 两 个 浮 点 数 来 表示 复数 。 这 些 复数 可 以 使 用 NumPy 的 sort_complex 函 数 进行 排序 。 该 函数 


(1) 生成 5 个 随机 数 作 为 实 部 ，5 个 随机 数 作为 虚 部 。 设 置 随机 数 种 子 为 42: 


np.random.seed(42) 


complex numbers = np.random.random(5) + 1j * np.random.random(5) 


print "Complex numbers\n", complex numbers 


(2) 调用 sort_complex 了 哺 数 对 上 面 生 成 的 复数 进行 排序 : 








print "Sorted\n", np.sort complex (complex numbers) 
排序 后 的 结果 如 下 : 


Sorted 
[ 0.39342751+0.34955771j 0.40597665+0.77477433j 
0.41516850+0.26221878j 

0.86631422+0.74612422j 0.92293095+0.81335691j] 





刚才 做 了 些 什么 





我 们 生成 了 随机 的 复数 并 使 用 sort_complex 了 函数 对 它们 进行 了 排序 。 示 例 代 码 见 


sortcomplex.py 文 件 。 
import numpy as np 


np.random.seed(42) 


complex numbers = np.random.random(5) + 1j * np.random.random(5) 


print "Complex numbers\n", complex numbers 


print "Sorted\n", np.sort_ complex(complex numbers) 
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突击 测验 : 生成 随机 数 


问题 1 以 下 哪 一 个 NumPy 模 块 可 以 生成 随机 数 ? 
(1) randnum 

(2) random 

(3) randomutil 

(4) rand 


EE 
7.5 搜索 

NumPy 中 有 多 个 因数 可 以 在 数组 中 进行 搜索 ， 如 下 所 示 。 

口 argmax 了 哺 数 返回 数组 中 最 大 值 对 应 的 下 标 。 





>>> a = np.array([2, 4, 8]) 
>>> np.argmax(a) 
2 


口 nanargmax 函 数 提供 相同 的 功能 ， 但 忽略 NaN 值 。 


>>> b = np.array([np.nan，2，4]) 
>>> np .nanargmax (Pb) 
2 


D argmin 和 nanargmin 国 数 的 功能 类 似 ， 只 不 过 换 成 了 最 小 值 。 
D argwhere 辑 数 根据 条 件 搜索 非 零 的 元 素 ， 并 分 组 返回 对 应 的 下 标 。 








>>> a = np.array([2, 4, 8]) 
>>> np.argwhere(a <= 4) 
array([[0], 

[1]]) 


口 searchsorted 函 数 可 以 为 指定 的 插入 值 寻 找 维持 数组 排序 的 索引 位 置 。 该 函数 使 用 二 分 
搜索 算法 ， 计算 复杂 度 为 O(log(n))。 我 们 随后 将 具体 学 习 这 个 水 数 。 
口 sxtzact 函 数 返回 满足 指定 条 件 的 数组 元 素 。 




















7.6 动手 实践 : 使 用 searchsorted 函数 


searchsorted 函 数 为 指定 的 搬入 值 返回 一 个 在 有 序数 组 中 的 索引 位 置 , 从 这 个 位 置 插 入 可 
以 保持 数组 的 有 序 性 。 下 面 的 例子 可 以 解释 得 更 清楚 。 请 完成 如 下 步骤 。 


(1) 我 们 需要 一 个 排序 后 的 数组 。 使 用 arange 函 数 创建 一 个 升序 排列 的 数组 : 
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a = np.arange(5) 
(2) 现在 ， 我 们 来 调用 searchsorted 国 数 : 


indices = np.searchsorted(a, [-2, 7]) 
print "Indices", indices 


下 面 的 索引 即 可 以 维持 数组 排序 的 搬入 位 置 : 

Indices [0 5] 

(3) 使 用 insezrt 函 数 构建 完整 的 数组 : 

print "The full array", np.insert(a, indices, [-2, 7]) 
结果 如 下 : 


The full array [-2 012347] 





刚才 做 了 些 什么 





searchsorted 困 数 为 7 和 -2 返回 了 索引 $ 和 0。 用 这 些 索引 作为 插入 人 位置， 我们 生成 了 数组 
[-2，0，1，2，3，4，7]， 这 样 就 维持 了 数组 的 排序 。 示 例 代 码 见 sortedsearch.py 文 件 。 


import numpy as np 


a = np.arange(5) 


indices = np.searchsorted(a, [-2, 7]) 
print "Indices", indices 
print "The full array", np.insert(a, indices, [-2, 7]) 


7.7 数组 元 素 抽取 


NumPy 的 extract 了 水 数 可 以 根据 某 个 条 件 从 数组 中 抽取 元 素 。 该 函数 和 我 们 在 第 3 章 中 遇 到 
过 的 where 函 数 相 似 。nonzero 国 数 专门 用 来 抽取 非 零 的 数组 元 素 。 








7.8 动手 实践 : 从 数组 中 抽取 元 素 
我 们 要 从 一 个 数组 中 抽取 偶数 元 素 ， 步 又 如 下 。 
(1) 使 用 arange 函 数 创建 数组 : 
a = np.arange(7) 
(2) 生成 选择 偶数 元 素 的 条 件 变量 : 


CoOndition = (a SS 2) Es 0 
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(3) 使 用 extract 函 数 基 于 生成 的 条 件 从 数组 中 抽取 元 素 : 
print "Even numbers", np.extract (condition, a) 

输出 数组 中 的 偶数 元 素 ， 如 下 所 示 : 

Even numbers [0 2 4 6] 


(4) 使 用 nonzero 函 数 抽取 数组 中 的 非 零 元 素 : 





print "Non zero", np.nonzero(a) 


输出 结果 如 下 : 





Non zero (array([1, 2, 3, 4, 5, 6]),) 


刚才 做 了 些 什么 


我 们 使 用 extract 函 数 根据 一 个 指定 的 布尔 条 件 从 数组 中 抽取 了 偶数 元 素 。 示 例 代 码 见 
extracted.py 文 件 。 





import numpy as np 


a = np.arange(7) 

condition = (a % 2) == 0 

print "Even numbers", np.extract (condition, a) 
print "Non zero", np.nonzero(a) 


7.9 ”金融 函数 


NumPy 中 有 很 多 金融 函数 ， 如 下 所 示 。 


口 Ev 函数 计算 所 谓 的 终 值 (future value )， 即 基于 一 些 假 设 给 出 的 某 个 金融 资产 在 未 来 某 一 
时 间 点 的 价值 。 

口 pv 函数 计算 现 值 (present value )， 即 金融 资产 当前 的 价值 。 

口 npv 函 数 返回 的 是 净 现 值 (net present value )， 即 按 折 现 率 计 算 的 净 现 金 流 之 和 。 

口 pmt 函 数 根据 本 金 和 利率 计算 每 期 需 支 付 的 金额 。 

口 ixz 国 数 计算 内 部 收益 率 (internal rate of return )。 内 部 收益 率 是 是 净 现 值 为 0 时 的 有 效 利 
率 ， 不 考虑 通胀 因素 。 

口 mirr 函 数 计算 修正 后 内 部 收益 率 ( modified internal rate of return )， 是 内 部 收益 率 的 改进 
版 本 。 

口 npez 函 数 计算 定期 付款 的 期 数 。 

口 rate 国 数 计算 利率 ( rate of interest )。 
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7.10 动手 实践 : 计算 终 值 




















终 值 是 基于 一 些 假设 给 出 的 某 个 金融 资产 在 未 来 某 一 时 间 点 的 价值 。 终 值 决定 于 4 个 参 


数 一 一 利率 、 期 数 、 每 期 支付 金额 以 及 现 值 。 在 本 节 的 教程 中 ,我 们 以 利率 3%、 每 季度 支付 


八 


区 








十 


额 10、 存 款 周 期 5 年 以 及 现 值 1 000 为 参数 计算 终 值 。 


使 用 正确 的 参数 调用 fv 函数 ， 计 
print "Future value", np.fv(0 


结果 如 下 : 
Future value 1376.09633204 


这 相当 于 利率 3% 的 5 年 期 存款 并 | 





算 终 值 : 


:03/4; 5 * 4; =10; =1000) 


日 每 季度 额外 存 和 10 个 单位 的 资金 。 如 果 我 们 改变 存款 的 年 


数 并 保持 其 他 参数 不 变 ， 将 得 到 如 下 的 散 点 图 。 























刚才 做 了 些 什么 





我 们 以 利率 3%、 每 季度 支付 金额 10、 存 款 周期 5 年 以 及 现 值 1 000 为 参数 ， 使 用 NumPy 中 的 
fv 函数 计算 了 终 值 。 我 们 针对 不 同 的 存款 周期 绘制 了 终 值 的 散 点 图 。 示 例 代码 见 futurevalue.py 


文件 。 
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import numpy as np 
from matplotlib.pyplot import plot, show 


print "Future value", np.fv(0.03/4, 5 * 4, -10, -1000) 
fvals = [] 


for i in xrange(l1, 10): 
fvals.append(np.fv(.03/4, i * 4, -10, -1000)) 


BIot(ftvals, bo) 
show() 


7.11 ” 现 值 


现 值 (present value ) 是 指 资产 在 当前 时 刻 的 价值 。NumPy 中 的 pv 函数 可 以 计算 现 值 。 该 函 
数 和 fv 函数 是 镜像 对 称 的 , 同样 需要 利率 、 期 数 、 每 期 支付 金额 这 些 参数 , 不 过 这 里 输入 为 终 值 ， 
输出 为 现 值 。 




















7.12 ”动手 实践 : 计算 现 值 
我 们 来 进行 逆向 计算 使 用 前 一 节 教 程 中 的 数值 计算 现 值 。 
使 用 7.10 节 使 用 的 数值 来 计算 现 值 。 


print "Present value", np.pv(0.03/4, 5 * 4, -10, 1376.09633204) 


除去 微小 的 数值 误差 , 我 们 预期 的 计算 结果 应 该 为 1000。 而 实际 上 , 这 里 有 一 个 表示 形式 上 
的 问题 。 由 于 我 们 计算 的 是 支出 的 现金 流 ， 因 此 结果 前 面 有 一 个 负 号 。 


Present value -999.999999999 











刚才 做 了 些 什么 

我 们 对 上 一 节 教 程 中 的 终 值 进行 了 逆向 计算 ,得 到 了 现 值 。 这 是 用 NumPy 中 的 pv 函数 完 
成 的 。 
7.13” 净 现 值 


净 现 值 (net present value ) 定义 为 按 折 现 率 计算 的 净 现 金 流 之 和 。NumPy 中 的 npv 函 数 返 回 
净 现 值 。 该 函数 需要 两 个 参数 ， 即 利率 和 一 个 表示 现金 流 的 数组 。 


图 灵 社 区 会 员 heruihong 专 享 尊重 版 权 





132 第 7 章 专用 函数 





7.14 动手 实践 : 计算 净 现 值 
我 们 将 为 一 组 随机 生成 的 现金 流 计算 净 现 值 。 步 又 如 下 。 
(1) 生成 5 个 随机 数 作 为 现金 流 的 取 值 。 插 入 -100 作 为 初始 值 。 














cashflows = np.random.randint (100, size=5) 
cashflows = np.insert(cashflows, 0, -100) 
print "Cashflows", cashflows 


生成 的 现金 流 如 下 所 示 : 
Cashflows [-100 38 48 90 17 36] 


(2) 根据 上 一 步 生 成 的 现金 流 数 据 ， 调 用 npv 函 数 计算 净 现 值 。 利 率 按 3% 计 算 。 





print "Net present value", np.npv(0.03, cashflows) 
计算 出 的 净 现 值 如 下 : 


Net present value 107.435682443 


刚才 做 了 些 什么 

我 们 使 用 npv 函 数 为 一 组 随机 生成 的 现金 流 数据 计算 了 净 现 值 。 示 例 代码 见 netpresentvalue.py 
文件 。 

import numpy as np 

cashflows = np.random.randint (100, size=5) 

cashflows = np.insert(cashflows, 0, -100) 


print "Cashflows", cashflows 


print "Net present value", np.npv(0.03, cashflows) 


7.15 内 部 收益 率 


内 部 收益 率 (internal rate of return ) 是 净 现 值 为 0 时 的 有 效 利 率 ， 不 考虑 通胀 因素 。NumPy 
中 的 irr 函 数 根据 给 定 的 现金 流 数 据 返 回 对 应 的 内 部 收益 率 。 




















7.16 动手 实践 : 计算 内 部 收益 率 
这 里 我 们 复 用 7.14 节 中 的 现金 流 数据 。 
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使 用 之 前 教程 中 生成 的 现金 流 数 组 ， 调 用 irr 函 数 。 
print "Internal rate of return", np.irr([-100, 38, 48, 90, 17, 36]) 
计算 出 的 内 部 收益 率 如 下 : 


Internal rate of return 0.373420226888 


刚才 做 了 些 什么 


我 们 使 用 之 前 的 “动手 实践 ”教程 中 生成 的 现金 流 数 据 , 计算 了 对 应 的 内 部 收益 率 。 这 是 用 
NumPy 中 的 irr 函 数 完成 的 。 





7.17 分 期 付款 
Numpy 中 的 pmt 函数 可 以 根据 利率 和 期 数 计算 贷款 每 期 所 需 支付 的 资金 。 


7.18 动手 实践 : 计算 分 期 付款 


假设 你 贷款 100 万 ， 年 利率 为 10%， 要 用 30 年 时 间 还 完 贷款 ,那么 每 月 你 必须 支付 多 少 资金 
呢 ? 我 们 来 计算 一 下 。 


使 用 刚才 提 到 的 参数 值 ， 调 用 pmt 函 数 。 


print "Payment", np.pmt (0.10/12, 12 * 30, 1000000) 


计算 出 的 月 供 如 下 所 示 : 
Payment -8775.71570089 
刚才 做 了 些 什么 


我 们 计算 了 贷款 100 万 、 年 利率 10% 的 情况 下 的 月 供 金额 。 设 定 还 款 时 间 为 30 年 ,pmt 函 数 告 
诉 我 们 每 月 需要 偿还 的 资金 为 8 775.715 700 89。 





7.19 ”付款 期 数 


NumPy 中 的 nper 函 数 可 以 计算 分 期 付款 所 需 的 期 数 。 所 需 的 参数 为 贷款 利率 、 固 定 的 月 供 
以 及 贷款 额 。 
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7.20 动手 实践 : 计算 付款 期 数 
考虑 贷款 9 000， 年 利率 10%， 每 月 固定 还 款 为 100 的 情形 。 
通过 nper 函 数 计算 出 付款 期 数 。 
print "Number of payments", np.nper(0.10/12, -100, 9000) 
计算 出 的 付款 期 数 如 下 : 


Number of payments 167.047511801 


刚才 做 了 些 什么 
我 们 计算 了 贷款 9000、 年 利率 10%、 每 月 固定 还 款 100 的 情形 下 所 需 的 付款 期 数 。 结 果 为 167 


个 月 。 





7.21 利率 
NumPy 中 的 rate 函 数 根据 给 定 的 付款 期 数 、 每 期 付款 资金 、 现 值 和 终 值 计算 利率 。 


7.22 动手 实践 : 计算 利率 
我 们 使 用 7.20 节 中 的 数值 进行 逆向 计算 ， 由 其 他 参数 得 出 利率 。 
填 入 之 前 教程 中 的 数值 作为 参数 。 
print "Interest rate", 12 * np.rate(167, -100, 9000, 0) 
如 我 们 所 料 ， 计 算出 的 利率 约 为 10%。 


Interest rate 0.0999756420664 


刚才 做 了 些 什么 


我 们 使 用 了 NumPy 的 rate 函 数 和 之 前 的 “动手 实践 ”教程 中 的 数值 ， 计 算 了 贷款 利率 。 忽 
略 舍 人 误差 ， 我 们 得 到 了 原先 的 利率 10%。 





7.23 窗 函 数 
窗子 数 ( window function ) 是 信号 处 理 领 域 常用 的 数学 函数 ， 相 关 应 用 包括 谱 分 析 和 滤波 器 设 
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计 等 。 这些 窗 函数 除 在 给 定 区 间 之 外 取 值 均 为 0.NumPy 中 有 很 多 窗 函 数 , 如 bartlett、blackman、 
hamming、hanning 和 kaiser。 关 于 hanning 轴 数 的 例子 可 以 在 第 4 章 和 第 3 章 中 找到 。 


7.24 ”动手 实践 : 绘制 巴特 利 特 窗 
巴特 利 特 窗 ( Bartlett window ) 是 一 种 三 角形 平滑 窗 。 按 如 下 步骤 绘制 巴特 利 特 窗 。 
(1) 调用 NumPy 中 的 bartlett 函 数 ， 以 计算 巴特 利 特 窗 。 
window = np.bartlett (42) 
(2) 使 用 Matplotlib 绘 制 巴特 利 特 窗 ， 非 常 简 单 。 


plot (window) 
Show() 





绘制 结果 如 下 图 所 示 ， 形 状 确实 为 三 角形 。 























刚才 做 了 些 什 么 
我 们 使 用 NumPy 中 的 bartlett 函 数 绘制 了 巴特 利 特 窗 。 


7.25 布莱克 曼 窗 
布莱克 曼 窗 (Blackman window ) 形式 上 为 三 项 余弦 值 的 加 和 ， 如 下 所 示 : 
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wn) = 0.42 — 0.5¢cos(2rn/M) + 0.08cos(4rn/M) 


NumPy 中 的 blackman 消 数 返 回 布莱克 曼 窗 。 该 函数 唯一 的 参数 为 输出 点 的 数量 。 如 果 数 量 
为 0 或 小 于 0， 则 返回 一 个 空 数组 。 














7.26 ”动手 实践 : 使 用 布莱克 曼 窗 平滑 股价 数据 
我 们 对 AAPL 股 价 的 小 数据 文件 中 的 收盘 价 数据 进行 平滑 处 理 。 完 成 如 下 步骤。 
(D 将 数据 载 人 NumPy 数 组 。 调 用 blackman 函 数 生成 一 个 平滑 窗 并 用 它 来 平滑 股价 数据 。 


Closes=np.LIoadtxt ('AAPL.csv'，dqelimiter='，'，usecols=(6,)， 
Converters={1:dqatestr2num} ，unpack=True) 

N= int(sys.argv[1]) 

window = np.blackman (N) 

smoothed = np.convolve (window/window.sum(), closes, mode='same') 


(2) 使 用 Matplotlib 绘 制 平滑 后 的 股价 图 。 在 这 个 例子 中 ， 我 们 将 省 略 最 前 面 5 个 和 最 后 面 5 个 
数据 点 。 这 是 由 于 存在 很 强 的 边界 效应 。 


plot (smoothed[N:-N], lw=2, label="smoothed") 
plot(closes[N:-N], label="closes") 

legend (loc='best') 

Show() 


经 过 布莱克 曼 窗 平滑 后 的 AAPL 收 盘 价 数据 如 下 所 示 。 





























-一 Smoothed 
-一 closes 





355Fr 


350 上 


345 上 
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刚才 做 了 些 什么 


我 们 使 用 NumPy 中 的 blackman 函 数 生 成 的 布莱克 曼 窗 对 AAPL 收 盘 价 数据 进行 了 平滑 处 
理 ， 并 用 Matplotlib 绘 制 了 平滑 前 后 的 股价 图 。 示 例 代码 见 plot_blackman.py 文 件 。 


import numpy as np 

from matplotlib.pyplot import plot, show, legend 
from matplotlib.dates import datestr2num 

import sys 





closes=np.loadtxt('AAPL.csv', delimiter=',', usecols=(6,), 
converters={1:datestr2num}, unpack=True) 

N = int(sys.argv[1]) 

window = np.blackman (N) 

smoothed = np.convolve (window/window.sum(), closes, mode='same') 
plot(smoothed[N:-N], lw=2, label="smoothed") 

plot(closes[N:-N], label="closes") 

legend (loc='best') 

Show() 


7.27” 汉 明 窗 
汉 明 窗 (Hamming window ) 形式 上 是 一 个 加 权 的 余弦 函数 。 公 式 如 下 所 示 。 











2 
wD =0.54+046e0s| | 0 入 7 和 及 AM-l 








NumPy 中 的 hamming 消 数 返回 汉 明 窗 。 该 函数 唯一 的 参数 为 输出 点 的 数量 。 如 果 数 量 为 0 或 
小 于 0， 则 返回 一 个 空 数组 。 7 





7.28 动手 实践 : 绘制 汉 明 窗 
我 们 来 绘制 汉 明 和 窗 。 完 成 如 下 步骤 。 
(1) 调用 hamming 函 数 ， 以 计算 汉 明 窗 : 
window = np.hamming (42) 
(2) 使 用 Matplotlib 绘 制 汉 明 窗 : 


plot (window) 
Show() 


绘制 结果 如 下 图 所 示 。 





刚才 做 了 些 什么 
我 们 使 用 NumPy 中 的 hamming 少 数 绘制 了 汉 明 窗 。 
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7.29 凯 泽 窗 


凯 泽 窗 (Kaiser window ) 是 以 贝 塞 尔 困 数 ( Bessel function ) 定义 的 ， 公 式 如 下 所 示 。 


15 和 
so 二 下 Er 


这 里 的 五 即 为 零 阶 的 贝 塞 尔 函 数 。NumPy 中 的 kaiser 困 数 返 回 凯 泽 窗 。 该 函数 的 第 一 个 参 
数 为 输出 点 的 数量 。 如 果 数 量 为 0 或 小 于 0， 则 返回 一 个 空 数 组 。 第 二 个 参数 为 8 值 。 

















7.30 动手 实践 : 绘制 凯 泽 窗 
我 们 来 绘制 凯 译 窗 。 完 成 如 下 步骤 。 
(1) 调用 kaiser 函 数 ， 以 计算 遇 泽 和 窗 : 





window = np.kaiser(42, 14) 
(2) 使 用 Matplotlib 绘 制 凯 泽 窗 : 


plot (window) 
Show() 
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绘制 结果 如 下 图 所 示 。 











1.0 T T 


0.8r 


0.4 上 

















刚才 做 了 些 什么 
我 们 使 用 NumPy 中 的 kaisezr 函 数 绘制 了 凯 泽 窗 。 


7.31 专用 数学 函数 


我 们 将 以 一 些 专用 数学 函数 结束 本 章 的 内 容 。 贝 塞 尔 函 数 ( Bessel function ) 是 贝 塞 尔 微分 
方程 的 标准 解 函 数 ( 详 见 http:/en.wikipedia.org/wiki/Bessel function )。 在 NumPy 中 ， 以 i0 表示 第 
一 类 修正 的 零 阶 贝 塞 尔 函 数 。sinc 函 数 在 NumPy 中 有 同名 函数 sinc， 并 且 该 函数 也 有 一 个 二 维 
版 本 。sinc 是 一 个 三 角 函 数 ， 更 多 详细 内 容 请 访问 http:/en.wikipedia.org/wiki/Sinc_function。 


























7.32 ”动手 实践 : 绘制 修正 的 贝 塞 尔 函 数 
我 们 来 看 看 第 一 类 修正 的 零 阶 贝 塞 尔 函 数 绘制 出 来 是 什么 形状 。 
(1) 使 用 NumPy 的 1inspace 函 数 生成 一 组 均匀 分 布 的 数值 。 





x = np.linspace(0, 4, 100) 
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(2) 调用 i0 函 数 进行 计算 : 
vals = np.i0 (x) 


(3) 使 用 Matplot1ib 绘 制 修正 的 贝 塞 尔 函 数 : 





plot (x, vals) 
show () 


绘制 结果 如 下 图 所 示 。 














12 























刚才 做 了 些 什 么 
我 们 使 用 NumPy 中 的 i0 函 数 绘制 了 第 一 类 修正 的 零 阶 贝 塞 尔 函 数 。 


7.33 ”sinc 函数 


sinc 函 数 在 数学 和 信号 处 理 领域 被 广泛 应 用 。NumPy 中 有 同名 函数 sinc， 并 且 也 存在 一 个 
二 维 版 本 。 


7.34 动手 实践 : 绘制 sinc 函数 
我 们 将 绘制 sinc 函 数 。 完 成 如 下 步 又。 
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(1) 使 用 NumPy 的 1inspace 函 数 生 成 一 组 均匀 分 布 的 数值 。 


x = np.linspace(0, 


(2) 调用 sinc 函 


4, 100) 


数 进行 计算 : 


vals = np.sinc (x) 


(3) 使 用 Matplotlib 绘 制 sinc 函 数 ; 








plot (x, vals) 
Show() 
绘制 结果 如 下 图 所 示 。 




















1.0 eS 2.0 2.5 3.0 





3.5 4.0 








sinc2d 子 数 需 要 输入 一 个 二 维 数组 。 我 们 可 以 用 outer 子 


刚才 做 了 些 什么 


数 生成 二 维 数组 ， 便 得 到 下 图 。 


我 们 使 用 NumPy 中 的 sinc 函 数 绘 制 了 著名 的 sinc 函 数 。 示 例 代码 见 plot_sinc.py 文 件 。 


import numpy as np 


from matplotlib.pyplot import plot, show 
x = np.linspace(0, 4, 100) 
vals = np.sinc (x) 
plot (x, vals) 
Show() 
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我 们 用 相同 的 方法 绘制 了 二 维 的 sinc 函 数 。 示 例 代 码 见 sinc2d.py 文 件 。 


import numpy as np 
from matplotlib.pyplot import imshow, show 


x = np.linspace(0, 4, 100) 
XX = np.outer (x, x) 


vals = np.sinc (xx) 


imshow (vals) 
Show() 


7.35 本章 小 结 


本 章 介 绍 了 一 些 专 用 性 较 强 的 NumPy 功 能 , 包括 排序 和 搜索 、 专 用 函数 、 金融 函 数 以 及 窗 函 
数 等 。 


在 下 一 章 中 ， 我 们 将 学 习 非 常 重要 的 程序 测试 方面 的 知识 。 
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有 些 程序 员 只 在 产品 中 做 测试 。 如 果 你 不 是 他 们 中 的 一 员 ， 你 可 能 会 对 
单元 测试 的 概念 耳熟能详 。 单 元 测试 是 由 程序 员 编 写 的 自动 测试 模块 ， 用 来 
测试 他 或 者 她 的 代码 。 这 些 单 元 测试 可 以 测试 某 个 函数 或 函数 中 的 某 个 独立 
的 部 分 。 每 一 个 单元 测试 仅仅 对 一 小 部 分 代码 进行 测试 。 单 元 测试 可 以 带 来 
诸多 好 处 ， 如 提高 代码 质量 、 可 重复 性 测试 等 ， 使 软件 副作用 更 为 清晰 。 

Python 本 身 对 单元 测试 就 有 良好 的 支持 。 此 外 ，NumPy 中 也 有 
numpy.testing 包 可 以 支持 NumPy 代 码 的 单元 测试 。 





TDD (Test Driven Development， 测 斌 驱动 的 开发 ) 是 软件 开发 史上 最 重要 的 里 程 碑 之 一 。 
TDD 主 要 专注 于 自动 单元 测试 , 它 的 目标 是 尽 最 大 限度 自动 化 测试 代码 。 如 果 代 码 被 改动 , 我们 
仍 可 以 运行 测试 并 捕捉 可 能 存在 的 问题 。 换 言 之 ， 测 试 对 于 已 经 存在 的 功能 模块 依然 有 效 。 


本 章 涵 盖 以 下 内 容 : 


口 单元 测试 ; 
口 断言 机 制 ; 
口 浮 点 数 精度 。 























8.1 断言 函数 


单元 测试 通常 使 用 断言 函数 作为 测试 的 组 成 部 分 。 在 进行 数值 计算 时 , 我 们 经 常 遇 到 比较 两 
个 近似 相等 的 浮 点 数 这 样 的 基本 问题 。 整 数 之 间 的 比较 很 简单 , 但 浮 点 数 却 非 如 此 , 这 是 由 于 计 
算 机 对 浮 点 数 的 表示 本 身 就 是 不 精确 的 。numpy .testing 包 中 有 很 多 实用 的 工具 函数 考虑 了 浮 
点 数 比较 的 问题 ， 可 以 测试 前 提 是 否 成 立 。 
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函数 描述 
assert_almost_equal 如 果 两 个 数字 的 近似 程度 没有 达到 指定 精度 ， 就 抛 出 异常 
Adar tpppror edued 如 果 两 个 数字 的 近似 程 度 没有 达到 指定 有 效 数字 ， 就 抛 出 异常 
assert_array_almost_equal ”如 果 两 个 数组 中 元 素 的 近似 程度 没有 达到 指定 精度 ， 就 抛 出 异常 
assert_arrey equal 如 果 两 个 数组 对 象 不 相同 ， 就 抛 出 异常 
assert_array_less 两 个 数组 必须 形状 一 致 ， 并 且 第 一 个 数组 的 元 素 严格 小 于 第 二 个 数组 的 元 素 ， 和 否则 

就 抛 出 异常 

assert_equal 如 果 两 个 对 象 不 相同 ， 就 抛 出 异常 
Se 车 用 填写 的 参数 调用 函数 没有 抛 出 指定 的 异常 ， 则 测试 不 通过 
assert_warns 若 没 有 抛 出 指定 的 警告 ， 则 测试 不 通过 
assert_string_equal 断言 两 个 字符 申 变量 完全 相同 
assert_allclose 如 果 两 个 对 象 的 近似 程度 超出 了 指定 的 容 差 限 ， 就 抛 出 异 党 





8.2 动手 实践 : 使 用 assert_almost _equal 断言 近似 相等 

假设 你 有 两 个 很 接近 的 数字 。 我 们 用 assert_almost_equal 函 数 来 检查 它们 是 否 近 似 
相等 。 

(1) 调用 函数 ， 指 定 较 低 的 精度 〈 小数 点 后 7 位 ): 


print "Decimal 6", np.testing.assert almost equal(0.123456789, 0.123456780, 
decimal=7) 


注意 ， 这 里 没有 抛 出 异常 ， 如 下 所 示 : 




















Decimal 6 None 
(2) 调用 函数 ， 指 定 较 高 的 精度 (小数 点 后 8 位 ): 


Print "Decimal 7", np.testing.assert almost equal(0.123456789, 0.123456780, 
decimal=8) 


结果 如 下 : 


Decimal 7 
Traceback (most recent call last): 


raiseAssertionError (msg) 

AssertionError: 

Arrays are not almost equal 
ACTUAL: 0.123456789 
DESIRED: 0.12345678 
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刚才 做 了 些 什么 








我 们 使 用 NumPy testing 包 中 的 assert_almost_ecual 函 数 在 不 同 的 精度 要 求 下 检查 了 
两 个 浮 点 数 0.123456789 和 0.123456780 是 否 近 似 相 等 。 





突击 测验 : 指定 精度 


问题 1 以 下 哪 一 个 是 assert_almost_equal 函 数 的 参数 ， 用 来 指定 小 数 点 后 的 精度 ? 
(1) decimal 





(2) precision 
(3) tolerance 


(4) significant 





8.3 近似 相等 
如 果 两 个 数字 的 近似 程度 没有 达到 指定 的 有 效 数 字 要 求 , assert_approx_eaual 辑 数 将 抛 
出 异常 。 该 函数 触发 异常 的 条 件 如 下 : 


abs(actual - expected) >= 10**- (significant - 1) 


8.4 动手 实践 : 使 用 assert_approx_equal 断言 近似 相等 
我 们 仍 使 用 前 面 “ 动 手 实 践 ” 教 程 中 的 数字 ,并 使 用 assert_approx_equal 函 数 对 它们 进 
(1) 调用 函数 ， 指 定 较 低 的 有 效 数字 位 : 


print "Significance 8", np.testing.assert approx equal(0.123456789, 
0.123456780,significant=8) 


结果 如 下 : 


Significance 8 None 


(2) 调用 函数 ， 指 定 较 高 的 有 效 数字 位 : 














print "Significance 9", np.testing.assert approx equal(0.123456789, 0.123456780, 
significant=9) 


抛 出 了 一 个 异常 : 


Significance 9 
Traceback (most recent call last): 
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raiseAssertionError (msg) 
AssertionError: 


Items are not equal to 9 significant digits: 


ACTUAL: 
DESIRED: 


0.123456789 
0.12345678 


刚才 做 了 些 什 么 








我 们 使 用 numpy .testing 包 中 的 assert_approx_equal 函 数 在 不 同 的 精度 要 求 下 检查 了 




















两 个 浮 点 数 0 .123456789 和 0 .123456780 是 否 


8.5 数组 近似 相等 





2 
almost_equalPp 函数 将 抛 出 异 
数组 中 的 元 素 : 


|expected - actual| < 0.5 10-decimal 


8.6 ”动手 实践 : 断言 数组 近似 相等 


我 们 使 用 前 面 “动手 实践 ”教程 中 的 数字 ， 


(1) 调用 函数 ， 指 定 较 低 的 精度 : 


没有 达到 指定 的 精度 要 求 ， 
常 。 该 函数 首先 检查 两 个 数组 的 形状 是 否 一 臻 ,然后 逐一 比较 两 个 


否 近 似 相等 。 


aSSeLrt_artray 





并 各 加 上 一 个 o 来 构造 两 个 数组 。 


print "Decimal 8"，mnp.testing.assert_array _ almost_ecual([0，0.123456789]， [0， 
0.123456780], decimal=8) 

结果 如 下 : 

Decimal 8 None 

(2) 调用 函数 ， 指 定 较 高 的 精度 

print "Decimal 9"，mnp.testing.assert_artray_ almost_edcual([0，0.123456789]， [0， 


0.123456780], decimal=9) 


抛 出 了 一 个 异常 : 


Decimal 9 
Traceback (most recent call last): 
assert_array_compare 
raiseAssertionError (msg) 
AssertionError: 
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Arrays are not almost equal 


(mismateh 50.0%) 


x: array([ 0. ; 0.12345679]) 
y: array([ 0. ) 0.12345678]) 
刚才 做 了 些 什么 


我 们 使 用 NumPy 中 的 assert_array_almost_equal 撒 数 比 较 了 两 个 数组 。 


勇敢 出 发 :比较 形状 不 一 致 的 数组 





使 用 NumPy 的 assert_array_almost_equal 函 数 比 较 两 个 形状 不 一 致 的 数组 。 





8.7 ”数组 相等 
如 果 两 个 数组 对 象 不 相同 ，assert_array_edual 图 数 将 抛 出 异常 。 两 个 数组 相等 必须 形 
状 一 致 且 元 素 也 严格 相等 ， 允 许 数组 中 存在 NaN 元 素 。 


此 外 , 比较 数组 也 可 以 使 用 assert_allclose 国 数 。 该 函数 有 参数 atol( absolute tolerance， 
绝对 容 差 限 ) 和 rtol ( relative tolerance， 相 对 容 差 限 )。 对 于 两 个 数组 a 和 pb， 将 测试 是 否 满 足以 
下 等 式 : 


|a -bl<= (atol + rtol * |b|) 








8.8 动手 实践 : 比较 数组 


我 们 使 用 刚刚 提 到 的 函数 来 比较 两 个 数组 。 我 们 仍 使 用 前 面 “ 动 手 实践 ”教程 中 的 数组 , 并 
增加 一 个 NaN 元 素 。 











(1) 调用 assert_allclose 捕 数 : 


print "Pass", np.testing.assert allclose([0, 0.123456789, np.nan], [0, 0.123456780, 
np.nan], rtol=le-7, atol=0) 
结果 如 下 : 


Pass None 
(2) 调用 assert_array_equal 函数 : 


print "Falil"，np.testing.assert_array_edqual([0，0.123456789,， np.nan], [0, 0.123456780, 
np.nan]) 
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抛 出 了 一 个 异常 


Fail 
Traceback (most recent call last): 


assert_array_compare 
raiseAssertionError (msg) 
AssertionError: 

Arrays are not equal 


(mismatch 50.0%) 


x ‘ariay(l 0 ,0.12345679, nan] 
vy arrEay (Ll 0 ,0.12345678, nan]) 
刚才 做 了 些 什么 


我 们 分 别 使 用 assert_allclose 和 assert_array_equal 子 数 比较 了 两 个 数组 。 


8.9 数组 排序 


两 个 数组 必须 形状 一 致 并 且 第 一 个 数组 的 元 素 严 格 小 于 第 二 个 数组 的 元 素 ， 否 则 assert_ 
array_less 国 数 将 抛 出 异常 。 





8.10 动手 实践 : 核对 数组 排序 
我 们 来 检查 一 个 数组 是 否 严格 大 于 另 一 个 数组 。 
(1) 调用 assert_array_less 函 数 比较 两 个 有 严格 顺序 的 数组 : 


print "Pass", np.testing.assert array_less([0, 0.123456789, np.nan], [1, 0.23456780, 
np.nan]) 


结果 如 下 : 
Pass None 


(2) 调用 assert_array_less 困 数 ， 使 测试 不 通过 


print "Fail", np.testing.assert array_less([0, 0.123456789, np.nan]，[0，0.123456780， 
np.nan]) 


抛 出 了 一 个 异常 : 


Fail 
Traceback (most recent call last): 


raiseAssertionError (msg) 
AssertionError: 
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Arrays are not less-ordered 


(mismatch 100.0%) 


X: array([ 0. ; OL2345679., nan]) 
vr arrayt(l ,0% ) 0.12345678.; nan]) 
刚才 做 了 些 什 么 


我 们 使 用 assert_array_less 国 数 比 较 了 两 个 数组 的 大 小 顺序 。 


8.11 ”对象 比较 


如 果 两 个 对 象 不 相同 ，assert_equal 函 数 将 抛 出 异常 。 这 里 的 对 象 不 一 定 为 NumPy 数 组 ， 
也 可 以 是 Python 中 的 列表 、 元 组 或 字典 。 





8.12 ”动手 实践 : 比较 对 象 
假设 你 需要 比较 两 个 元 组 。 我 们 可 以 用 assert_eaual 国 数 来 完成 。 


( 调用 assert_equal 国 数 : 





print "Equal?", np.testing.assert equal((1, 2), (1, 3)) 


抛 出 了 一 个 异常 





Equal? 
Traceback (most recent call last): 





raiseAssertionError (msg) 
AssertionError: 

Items are not equal: 
item=1 





ACTUAL: 2 
DESIRED: 3 











刚才 做 了 些 什么 
我 们 使 用 assert_equal 也 数 比较 了 两 个 元 组 一 一 两 个 元 组 并 不 相同 ， 因 此 抛 出 了 异常 。 





8.13 ”字符 串 比 较 


assert_string_equal 也 数 断言 两 个 字符 串 变 量 完全 相同 。 如 果 测 试 不 通过 , 将 会 抛 出 异 
常 并 显示 两 个 字符 串 之 间 的 差异 。 该 函数 区 分 字符 大 小 写 。 
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8.14 动手 实践 : 比较 字符 串 
比较 两 个 均 为 NumPy 的 字符 串 。 


(1) 调用 assert_string_equal 国 数 ， 比 较 一 个 字符 串 和 甚 自身。 显然， 该 测试 应 通过 : 








print "Pass"，mnp.testing.assert_string_edqual("NumPy"， "Numpy") 





测试 通过 : 
Pass None 


(2) 调用 assert_string_equal 呆 数 ， 比 较 一 个 字符 串 和 男 一 个 字母 完全 相同 但 大 小 写 有 
区 别 的 字符 串 。 该 测试 应 抛 出 异常 : 








print "Fail", np.testing.assert_string equal ("NumPy"， "Numpy") 
7 

抛 出 了 一 个 异常 : 

Fail 


Traceback (most recent call last): 


raiseAssertionError (msg) 
AssertionError: Differences in strings: 


- NumPy? bi 
+ Numpy? 
刚才 做 了 些 什么 


我 们 使 用 assert_string_equal 困 数 比 较 了 两 个 字符 串 。 当 字符 大 小 写 不 匹配 时 抛 出 


已 
天 肌 o 


8.15 浮 点 数 比 较 


浮 点 数 在 计算 机 中 是 以 不 精确 的 方式 表示 的 ， 这 给 比较 浮 点 数 带 来 了 问题 。NumPy 中 的 
assert_array_almost_eaual_nulp 和 assert_array_max_ulp 国 数 可 以 提供 可 靠 的 浮 点 数 
比较 功能 。ULP 是 Unit of Least Precision 的 缩写 ， 即 浮 点 数 的 最 小 精度 单位 。 根 据 IEEE 754 标 准 ， 
四 则 运算 的 误差 必须 保持 在 半 个 ULP 之 内 。 你 可 以 用 刻度 尺 来 做 对 比 。 公 制 刻度 尺 的 刻度 通常 精 
确 到 上 毫米， 而 更 高 精度 的 部 分 只 能 估 读 ,误差 上 界 通常 认为 是 最 小 刻度 值 的 一 半 ， 即 半点 米 。 


机 器 精度 ( machine epsilon ) 是 指 浮 点 运算 中 的 相对 侈 人 误差 上 界 。 机 需 精 度 等 于 ULP 相 对 
于 1 的 值 。NumPy 中 的 finfo 函 数 可 以 获取 机 器 精度 。Python 标 准 库 也 可 以 给 出 机 器 精度 值 ， 并 
应 该 与 NumPy 给 出 的 结果 一 致 。 
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8.16 动手 实践 : 使 用 assert _ array almost equal nulp 比较 


污 到 
孚 点 数 


我 们 在 实践 中 学 习 assert_array_almost_ equal_ nulp 函数 。 
(1) 使 用 finfo 函 数 确 定 机 器 精 度 


eps = np.finfo(float) .eps 
print "EPS", eps 


精度 如 下 : 
EPS 2.22044604925e-16 


(2) 使 用 assert_array_almost_eaqual_nulp 国 数 比较 两 个 近似 相等 的 浮 点 数 1.0 和 1.0 
+ eps (epsilon )， 然 后 对 1.0 + 2 * eps 做 同样 的 比较 : 


peint vm 

np.testing.assert array_almost_ equal nulp(1.0, 1.0 + eps) 
Drint V2 

np.testing.assert_array_almost equal nulp(1.0, 1.0 + 2 * eps) 


结果 如 下 : 


1 None 
2 
Traceback (most recent call last): 














assert_array_almost_equal_nulp 
raiseAssertionError (msg) 
AssertionError: X and Y are not equal to 1 ULP (max is 2) 











刚才 做 了 些 什 么 


我 们 使 用 finfo 函 数 获 取 了 机 器 精度 。 随 后 , 我 们 使 用 assert_array_almost_equal_nulp 8 
函数 比较 了 1.0 和 1.0 + eps， 测试 通过 ， 再 加 上 一 个 机 器 精度 则 抛 出 了 异常 。 





8.17 多 ULP 的 浮 点 数 比较 


assert_artray_max_ulp 函 数 可 以 指定 ULP 的 数量 作为 允许 的 误 益 上 界 。 参 数 maxu1lp 接 受 
整数 作为 ULP 数 量 的 上 限 ， 默 认 值 为 1。 





8.18 动手 实践 : 设置 maxulp 并 比较 浮 点 数 
我 们 仍 使 用 前 面 “ 动 手 实践 ”教程 中 比较 的 浮 点 数 ， 但 在 需要 的 时 候 设 置 maxulp 为 2。 
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(1) 使 用 finfo 函 数 确定 机 器 精度 : 


eps = np.finfo(float) .eps 
print "EPS", eps 


精度 如 下 : 
EPS 2.22044604925e-16 


(2) 与 前 面 的 “动手 实践 ”教程 做 相同 的 比较 ,但 这 里 我 们 使 用 assert_array_max_ulp 郴 
数 和 适当 的 maxulp 参 数值 : 


print "1", np.testing.assert array max ulp(1.0, 1.0 + eps) 
print "2", np.testing.assert array max ulp(1.0, 1 + 2 * eps, maxulp=2) 


输出 结果 如 下 : 


Re 
2 -20 


刚才 做 了 些 什 么 


我 们 仍 比 较 了 前 面 “动手 实践 ”教程 中 的 浮 点 数 , 但 在 第 二 次 比较 时 将 maxulp 设 置 为 2。 我 
们 使 用 assert_array_max_ulp 了 水 数 和 适当 的 maxulp 参 数值 通过 了 比较 测试 , 并 返回 了 指定 的 
ULP 数 量 。 


8.19 单元 测试 


单元 测试 是 对 代码 的 一 小 部 分 进行 自动 化 测试 的 单元 , 通常 是 一 个 函数 或 方法 。Python 中 有 
用 于 单元 测试 的 PyUnitAPI( Application Programming Interface, 应 用 程序 编程 接口 ), 作为 NumPy 
用 户 ， 我 们 还 可 以 使 用 前 面 学 习 过 的 断言 函数 。 





























8.20 动手 实践 : 编写 单元 测试 
我 们 将 为 一 个 简单 的 阶乘 函数 编写 测试 代码 ， 检 查 所 谓 的 程序 主 逻 辑 以 及 非法 输入 的 情况 。 
(1) 首先 ， 我 们 编写 一 个 阶乘 函数 : 
def factorial (n): 
ES 汪 三 - 站 二 
return 1 


i 0 去 2 
raise ValueError, "Unexpected negative value" 


return np.arange(l1, n+1) .cumprod() 
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代码 中 使 用 了 我 们 已 经 掌握 的 创建 数组 和 累 乘 计算 函数 arange 和 cumprod， 并 增加 了 一 些 
边界 条 件 的 判断 。 

(2) 现在 我 们 来 编写 单元 测试 。 编写 一 个 包含 单元 测试 的 类 ,继承 Python 标 准 库 unittest 模 
块 中 的 restcase 类 。 我 们 对 阶乘 函数 进行 如 下 调用 测试 : 
口 一 个 正 数 ， 测 试 程序 主 逻 辑 ; 
口 测试 边界 条 件 0; 
口 测试 负数 ， 应 抛 出 异常 。 




















class FactorialTest (unittest .TestCase) : 
def test_factorial(self) : 
# 计算 3 的 阶乘 ， 测 试 通过 
self.assertEqual(6, factorial(3)[-1]) 
np.testing.assert equal (np.array ([1, 2, 6]), factorial(3)) 





def test_ zero(self): 
# 计算 0 的 阶乘 ， 测 试 通过 
self.assertEqual(1, factorial(0)) 
def test negative(self): 
# 计算 负数 的 阶乘 ， 测 试 不 通过 
# 这 里 应 抛 出 ValueError 异 常 ， 但 我 们 断言 其 抛 出 IndexError 昼 常 
self.assertRaises (IndexError, factorial(-10)) 


我 们 有 意 使 得 其 中 一 项 测试 不 通过 ， 输 出 结果 如 下 所 示 : 


$ python unit test.py 




















ERROR: test negative (_ main .FactorialTest) 


Traceback (most recent call last): 
File "unit test.py", line 26, in test negative 
self.assertRaises (IndexError, factorial(-10)) 
File "unit test.py", line 9, in factorial 
raiseValueError, "Unexpected negative value" 
ValueError: Unexpected negative value 











Ran 3 tests in 0.003s 


FAILED (errors=1) 





刚才 做 了 些 什么 


我 们 对 阶乘 函数 的 程序 主 逻 辑 代 码 进行 了 测试 , 并 有 意 使 得 边界 条 件 的 测试 不 通过 。 示例 代 
人 码 见 unit testpy 文 件 。 
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import numpy as np 
import unittest 


def factorial (n): 
i 
return 1 


i mn < Os 
raise ValueError, "Unexpected negative value" 


return np.arange(l1, n+1) .cumprod() 


class FactorialTest (unittest.TestCase): 
def test_ factorial (self): 
# 计算 3 的 阶乘 ， 测 试 通 过 
self.assertEqual(6, factorial(3)[-1]) 
np.testing.assert equal (np.array ([1, 2, 6]), factorial(3)) 


def test_ zerol(self): 
# 计算 0 的 阶乘 ， 测 试 通 过 
self.assertEqual(1, factorial(0)) 


def test negative(self): 
# 计算 负数 的 阶乘 ， 测 试 不 通过 
# 这 里 应 抛 出 ValueError 异 常 ， 但 我 们 断言 其 抛 出 IndexError 异 常 
self.assertRaises (IndexError, factorial(-10)) 





if name == '_main ': 
unittest.main() 





8.21 nose 和 测试 装饰 器 


鼻子 (nose ) 是 长 在 嘴 上 方 的 器 官 ， 人 和 动物 的 呼吸 和 闻 都 依赖 于 它 。nose 同 时 也 是 一 种 
Python 框架 , 使 得 (单元 ) 测 试 更 加 容易 。nose 可 以 帮助 你 组 织 测试 代码 。 根据 nose 的 文档 ,“ 任 
何 能 够 匹配 testMatch 正 则 表达 式 (默认 为 (?:^| [b_.-]) [Tt]est ) 的 Python 源 代码 文件 、 文 
件 夹 或 库 都 将 被 收集 用 于 测试 ”。 nose 充 分 利用 了 装饰 器 ( decorator )。Python 装 饰 器 是 有 一 定 含 
义 的 对 函数 或 方法 的 注解 。numpy.testing 模 块 中 有 很 多 装饰 锅 。 









































装 饰 器 描 述 
numpy .testing.decorators.deprecated 在 运行 测试 时 过 滤 掉 过 期 警告 
numpy .testing.decorators.knownfailureif 根据 条 件 抛 出 KnownFailureTest 异 常 
numpy .testing.decorators.setastest 将 函数 标记 为 测试 函数 或 非 测试 函数 
numpy .testing.decorators. skipif 根据 条 件 扫 出 skipTest 异 常 
numpy .testing.decorators.slow 将 测试 函数 标记 为 “运行 缓慢 ” 
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此 外 ， 我 们 还 可 以 调用 aecorate_methodqs 函 数 ， 将 装饰 需 应 用 到 能 够 匹配 正则 表达 式 或 
字符 串 的 类 方法 上 。 
8.22 ”动手 实 践 : 使 用 测试 装饰 器 


我 们 将 直接 在 测试 函数 上 使 用 setastest 装 饰 器 。 我 们 在 另 一 个 方法 上 也 使 用 该 装饰 器 ， 
但 将 其 禁用 。 此 外 ， 我 们 还 将 跳 过 一 个 测试 ， 并 使 得 另 一 个 测试 不 通过 。 如 果 你 仍 未 安装 aose， 
请 先 完成 安装 步骤 。 


(1) 使 用 setuptools 安 装 nose: 








easy_install nose 
或 者 使 用 pip 安 装 : 
pip install nose 
(2) 我 们 将 一 个 函数 用 于 测试 ， 另 一 个 不 用 于 测试 。 


@setastest (False) 

def test_false(): 
pass 

@setastest (True) 

def test_true() : 
pass 


(G3) 我 们 可 以 使 用 skipif 装 饰 器 跳 过 测试 .这 里 , 我们 使 用 一 个 条 件 使 得 该 测试 总 是 被 跳 过 。 


@skipif (True) 
def test_skip(): 
pass 


(4) 添加 一 个 空 函 数 用 于 测试 ， 并 使 用 knownfailureif 装 饰 右 使 得 该 测试 总 是 不 通过 。 








@knownfailureif (True) 
def test _ alwaysfail(): 
pass 


(5) 定义 一 些 可 以 被 nose 执 行 的 函数 和 对 应 的 测试 类 


class TestClass () : 
def test_true2 (self): 
pass 


class TestClass2(): 


def test_false2 (self): 
pass 


(6) 我 们 将 上 一 步 的 第 二 个 孙 数 在 测试 中 禁 
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decorate_ methods (TestClass2, setastest(False), 'test_false2') 
(7) 执行 如 下 命令 ， 运 行 测试 : 


nosetests -V decorator_setastest.py 


decorator_setastest.TestClass.test_true2 ... ok 
decorator_setastest.test_ true ... ok 

decorator_test.test_ skip ... SKIP: Skipping test: test_ skipTest 
skipped due to test condition 

decorator_ test.test _ alwaysfail ... ERROR 





Traceback (most recent call last): 


File ".../nose/case.py", line 197, in runTest 
self.test(*self.arg) 
File ".../numpy/testing/decorators.py", line 213, in knownfailer 


raiseKknownFailureTest (msg) 
KnownFailureTest: Test skipped due to known failure 


Ran 4 tests in 0.001s 


FAILED (SKIP=1, errors=1) 


刚才 做 了 些 什么 


我 们 使 用 装饰 器 将 一 些 函 数 和 方法 在 测试 中 禁用 ， 使 得 它们 被 nose 忽 略 。 我 们 还 直接 使 用 























装饰 咒 和 qecorate_methodqs 国 数 跳 过 了 一 个 测试 ， 并 使 得 另 一 个 测试 不 通过 。 示 例 代 码 见 
decorator test.py 文 件 。 


from numpy.testing.decorators import setastest 
from numpy.testing.decorators import skipif 
from numpy.testing.decorators import knownfailureif 
from numpy.testing import decorate methods 
@setastest (False) 
def test_false(): 

pass 


@setastest (True) 

def test_true(): 
pass 

@skipif (True) 

def test_ skip(): 


pass 


@knownfailureif (True) 
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def test_alwaysfalil() : 
pass 


class TestClass(): 
def test_true2 (self): 
pass 
class TestClass2(): 
def test_false2 (self): 


pass 


decorate methods (TestClass2, setastest(False), 'test_false2') 


8.23 ”文档 字符 串 


文档 字符 串 〈docstring ) 是 内 论 在 Python 代码 中 的 类 似 交 互 式 会 话 的 字符 串 。 这 些 字符 串 可 以 
用 于 某 些 测试 ,也 可 以 仅 用 于 提供 使 用 示例 。numey.testing 模 块 中 有 一 个 函数 可 以 运行 这 些 测试 。 








8.24 动手 实践 : 执行 文档 字符 串 测试 


我 们 来 编写 一 个 简单 的 计算 阶乘 的 例子 , 但 不 考虑 所 有 的 边界 条 件 。 换言之 , 编写 一 些 测试 
不 能 通过 的 例子 。 


(1) 文档 字符 串 看 起 来 就 像 你 在 Python shell 中 看 到 的 文本 一 样 ( 包括 命令 提示 符 ) 我 们 将 有 
意 使 得 其 中 一 项 测试 不 通过 ， 看 看 会 发 生 什么 。 








Test for the factorial of 3 that should pass. 
>>> factorial (3) 
6 


Test for the factorial of 0 that should fail. 
>>> factorial (0) 
1 





(2) 我 们 将 用 下 面 这 一 行 NomPy 代 码 来 计算 阶乘 : 
return np.arange(1, n+1) .cumprod()[-1] 
为 了 演示 目的 ， 这 行 代码 有 时 会 出 错 。 


(3) 我 们 可 以 在 Python shell 中 通过 调用 numpy .testing 模 块 的 rundocs 阴 数 ， 从 而 执行 文档 
字符 串 测试 。 


>>>from numpy.testing import rundocs 
>>>rundocs('docstringtest .py') 
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Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File ".../numpy/testing/utils.py", line 998, in rundocs 
raiseAssertionError("Some doctests failed:\n%s" % "\n".join(msg)) 


AssertionError: Some doctests failed: 
类 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 炎炎 火炎 火炎 火炎 火炎 火炎 炎炎 类 火炎 火炎 火炎 火炎 炎炎 火炎 火炎 炎炎 炎炎 火炎 火炎 火炎 火炎 火炎 炎炎 炎炎 火炎 火炎 类 类 


尖 壳 过 家 


File "docstringtest.py", line 10, in docstringtest.factorial 
Failed example: 
factorial(0) 
Exception raised: 
Traceback (most recent call last): 
File ".../doctest.py", line 1254, in _ run compileflags, 1) in test.globs 
File "<doctestdocstringtest.factorial[1]>", line 1, in <module> 
factorial(0) 
File "docstringtest.py", line 13, in factorial 
return np.arange(1, n+1) .cumprod()[-1] 
IndexError: index -1 is out of bounds for axis 0 with size 0 


刚才 做 了 些 什 么 








我 们 编写 了 一 个 文档 字符 串 测试 ， 在 对 应 的 阶乘 函数 中 没有 考虑 0O 和 负数 的 情况 。 我 们 使 用 
numpy .testing 模 块 中 的 rundocs 聘 数 执行 了 测试 ， 并 得 到 了 “索引 错误 ”的 结果 。 示 例 代码 


见 docstringtest.py 文 件 。 


import numpy as np 


def factorial (n): 
Test for the factorial of 3 that should pass. 
>>> factorial (3) 
6 


Test for the factorial of 0 that should fail. 
>>> factorial(0) 
a 


return np.arange(1, n+1) .cumprod()[-1] 


8.25 ”本 章 小 结 


在 本 章 中 ， 我 们 学 习 了 代码 测试 和 NumPy 中 的 测试 工具 。 涵盖 的 内 容 包括 单元 测试 、 文 档 
字符 串 测 试 、 断 言 郴 数 和 浮 点 数 精度 。 大 部 分 NumPy 断 言 函 数 都 与 浮 点 数 精度 有 关 。 我 们 演示 了 
可 以 被 nose 使 用 的 Numpy 装 饰 器 的 用 法 。 装 饰 器 使 得 测试 更 加 容易 使 用 ， 并 体现 开发 者 的 意图 。 








下 一 章 将 要 讨论 的 是 xatplot1lib 一 一 开源 的 Python 科学 可 视 化 和 绘图 工具 库 。 
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Matplotlib 是 一 个 非常 有 用 的 Python 绘图 库 。 它 和 NumPy 结 合 得 很 好 ， 但 
本 身 是 一 个 单独 的 开源 项 目 。 你 可 以 访问 http://matplotlib.sourceforge.net/ 
gallery.html 查 看 美妙 的 示例 图 库 。 

Matplotlib 中 有 一 些 功 能 函数 可 以 从 雅虎 财经 频道 下 载 并 处 理 数 据 。 我 们 
将 看 到 几 个 股价 图 的 例子 。 


章 涵 盖 以 下 内 容 : 
口 简单 绘图 ; 
口子 图 ; 

口 直方 图 ; 

口 定制 绘图 ; 
三 维 绘图 ; 
等 高 线 图 ; 
动画 ; 

对 数 坐标 图 。 








口 
口 
口 
口 


9.1 简单 绘图 


matplot1ib.pyplot 包 中 包含 了 简单 绘图 功能 。 需要 记 住 的 是 ， 随 后 调用 的 函数 都 会 改变 
当前 的 绘图 。 最 终 ， 我 们 会 将 绘图 存 人 文件 或 使 用 show 函 数 显 示 出 来 。 不 过 如 果 我 们 用 的 是 运 
行 在 Qt 或 Wx 后 端的 IPython， 图 形 将 会 交互 式 地 更 新 ， 而 不 需要 等 待 show 函 数 的 结果 。 这 类 似 于 
屏幕 上 输出 文本 的 方式 ， 可 以 源源 不 断 地 打印 出 来 。 




















9.2 动手 实践 : 绘制 多 项 式 函 数 
为 了 说 明 绘图 的 原理 ， 我 们 来 绘制 多 项 式 函数 的 图 像 。 我 们 将 使 用 NumPy 的 多 项 式 函数 
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poly1d 来 创建 多 项 式 。 
(1) 以 自然 数 序列 作为 多 项 式 的 系数 ， 使 用 poly1d 函 数 创建 多 项 式 。 
func = np.polyld(np.array([1，2，3，4]) .astype(float) ) 
(2) 使 用 NumPy 的 1inspace 函 数 创 建 z 轴 的 数值 ， 在 -10 和 10 之 间 产 生 30 个 均匀 分 布 的 值 。 
x = np.linspace(-10, 10, 30) 
(3) 计算 我 们 在 第 一 步 中 创建 的 多 项 式 的 值 。 
y = func(x) 


(4) 调用 plot 函 数 ， 这 并 不 会 立刻 显示 函数 图 像 。 





plt.plot (x, y) 

(5) 使 用 xlabel 函 数 添 加 x 轴 标签 
plt.xlabel('x') 

(6) 使 用 ylabel1 函 数 添 加 ? 轴 标 签 
plt.ylabel('y(x)') 


(7) 调用 show 函 数 显 示 孔 数 图 像 。 








plt.show( 


绘制 的 多 项 式 函数 如 下 图 所 示 。 
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刚才 做 了 些 什么 


我 们 绘制 了 多 项 式 函 数 的 图 像 并 显示 在 屏幕 上 。 我 们 对 x 轴 和 y 轴 添加 了 文本 标签 。 示 例 代码 
见 polyplot.py 文 件 。 





import numpy as np 
import matplotlib.pyplot as plt 


func = np.polyld(np.array ([1, 2, 3, 4]).astype(float)) 
x = np.linspace(-10, 10, 30) 
y = func(x) 


DltipLIot(w. Y) 
plt.xlabel('x') 
plt.ylabel('y(x)') 
plt.show!() 





突击 测验 : plot 函 数 


问题 1 plot 函 数 的 作用 是 什么 ? 
(1) 在 屏幕 上 显示 二 维 绘图 的 结果 
(2) 将 二 维 绘图 的 结果 存 入 文件 
(3) 1 和 2 都 是 

(4) 1、2、3 都 不 是 





9.3 格式 字符 串 


plot 消 数 可 以 接受 任意 个 数 的 参数 。 在 前 面 一 节 中 ， 我 们 给 了 两 个 参数 。 我 们 还 可 以 使 用 
可 选 的 格式 字符 串 参 数 指定 线条 的 颜色 和 风格 , 默认 为 b- 即 蓝 色 实 线 。 你 可 以 指定 为 其 他 颜色 和 
风格 ， 如 红色 虚线 。 

















9.4 动手 实践 : 绘制 多 项 式 函 数 及 其 导 函 数 
我 们 来 绘制 一 个 多 项 式 函数 ， 以 及 使 用 aerive 函 数 和 参数 m 为 1 得 到 的 其 一 阶 导 函数 。 我 们 
已 经 在 之 前 的 “动手 实践 ”教程 中 完成 了 第 一 部 分 。 我 们 希望 用 两 种 不 同 风格 的 曲线 来 区 分 两 条 
(1) 创建 多 项 式 函数 及 其 导 函数 。 


func = np.polyld(np.array ([1, 2, 3, 4]) .astype (float) 
funcl = func.deriv (m=1) 
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np.linspace(-10, 10, 30) 
func (x) 
| = funcl (x) 


y 三 
y1] 
(2) 以 两 种 不 同 风 格 绘制 多 项 式 函 数 及 其 导 函 数 : 红色 圆 形 和 绿色 虚线 。 你 可 能 无 法 在 本 书 
的 印刷 版 中 看 到 彩色 图 像 ， 因 此 只 能 自行 尝试 绘制 图 像 。 

It.plot(x, Y, ro', xX; Yl, 'g-="') 

lt.xlabel('x') 

It.ylabel('y') 

It.show!() 





ee 


绘制 结果 如 下 图 所 示 。 




















刚才 做 了 些 什 么 


我 们 使 用 两 种 不 同 风 格 的 曲线 绘制 了 一 个 多 项 式 函 数 及 其 导 函 数 ， 并 只 调用 了 一 次 plLot 函 
数 。 示 例 代 码 见 polyplot2.py 文 件 。 


import numpy as np 
import matplotlib.pyplot as plt 


func = np.polyld(np.array ([1, 2, 3, 4]).astype(float)) 
funcl = func.deriv(m=1) 

x = np.linspace(-10, 10, 30) 

y = func(x) 

V1 = funel (x) 
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Dlt 有 本 全 (其 YY "FO Ry Yl "gg==") 
plt.xlabel('x') 

blt vlabel(yY’) 

plt.show!() 


9.5 子 图 


绘图 时 可 能 会 遇 到 图 中 有 太 多 曲线 的 情况 ， 而 你 希望 分 组 绘制 它们 。 这 可 以 使 用 subplot 





9.6 ”动手 实践 : 绘制 多 项 式 防 数 及 其 导 函 数 

我 们 来 绘制 一 个 多 项 式 函数 及 其 一 阶 和 二 阶 导 函 数 。 为 了 使 绘图 更 加 清晰 ， 我 们 将 绘制 3 张 
子 图 。 

(1) 创建 多 项 式 函数 及 其 导 函数 。 

func = np.polyld(np.array([1, 2, 3, 4]).astype(float)) 


x = np.linspace(-10, 10, 30) 
下 


func1 = func.deriv (m=1) 
V1 EC 全) 
func2 = func.deriv (m=2) 


V2 = func2(x) 


(2) 使 用 subplot 函 数 创 建 第 一 个 子 图 。 该 函数 的 第 一 个 参数 是 子 图 的 行 数 ， 第 二 个 参数 
是 子 图 的 列 数 ， 第 三 个 参数 是 一 个 从 1 开始 的 序号 。 另 一 种 方式 是 将 这 3 个 参数 结合 成 一 个 数 
字 ， 如 311。 这 样 ， 子 图 将 被 组 织 成 3 行 1 列 。 设 置 子 图 的 标题 为 Polynomial， 使 用 红色 实 线 
绘制 。 

plt.subplot(311) 


Dlt.plot(x, Y;, 'r-") 
plt.title("Polynomial") 





























三 角形 绘制 。 


plt.subplot (312) 
Blt plotilw, VL "rr") 
plt.title("First Derivative") 


(4) 使 用 subplot 函 数 创建 第 三 个 子 图 。 设 置 子 图 的 标题 为 Secong Derivative， 使 用 绿 
色 圆 形 绘制 。 


plt.subplot (313) 
pLIt.BLot (x ‘yy2, "go") 





(3) 使 用 subplot 函 数 创建 第 二 个 子 图 。 设 置 子 图 的 标题 为 First Derivative， 使 用 蓝 色 9 
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plt.title("Second Derivative") 
plt.xlabel ('x') 
plt.ylabel('y') 
plt.show!() 


以 1、2、3、4 为 系数 的 多 项 式 函 数 ， 及 其 一 阶 和 二 阶 导 数 的 图 像 如 以 下 3 个 子 图 所 示 。 














1500 Polynomial 
1000| 
500| 
0| 
-500| 
0 -5 - RN 5 10 
et First Derivative 
300| 
250| 
200| 
150| 
100| 
50| 
0 -5 0 5 10 
Second Derivative 
80| 
60| 
40 
20| 
> 
0| 
一 20| 
一 40| 
7 -5 0 5 10 
x 
刚才 做 了 些 什么 





我 们 使 用 3 种 不 同 风 格 的 曲线 在 3 张 子 





图 中 分 别 绘制 了 一 个 多 项 式 函 数 及 其 一 阶 和 二 阶 导 画 


数 ， 子 图 排列 成 3 行 1 列 。 示 例 代 码 见 polyplot3.py 文 件 。 


import numpy as np 

import matplotlib.pyplot as plt 
func = np.polyld (np.array( [1, 2,; 3 
x = np.linspace(-10, 10, 30) 

y = func (x) 

funcl = func.deriv(m=1) 

yl1 = funcl (x) 

func2 = func .deriv (m=2) 


Y3 = func2 (x) 


plt.subplot (311) 
plt.plot(x, Yy, 'r-' ) 
plt.title("Polynomial") 


， 4]).astype (float)) 
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plt .subplot(312} 

pl1t. pLot (RK, YL "Pe") 
plt.title("First Derivative") 
plt.subplot (313) 

Dlt,plot{(xw, v2 vo") 
plt.title("Second Derivative") 
plt.xlabel('x') 
plt.ylabel('y') 

plt.show!() 


9.7 财经 


Matplotlib 可 以 帮助 我 们 监控 股票 投资 。 使 用 matplotlib.finance 包 中 的 函数 可 以 从 雅虎 
财经 频道 (http:/finance.yahoo.comy ) 下 载 股 价 数据 ， 并 绘制 成 K 线 图 ( candlestick )。 








9.8 动手 实践 : 绘制 全 年 股票 价格 


我 们 可 以 使 用 matplot1lib .finance 包 绘制 全 年 的 股票 价格 。 获 取 数 据 源 需 要 连接 到 雅虎 
财经 频道 。 


(1) 将 当前 的 日 期 减 去 1 年 作为 起 始 日 期 。 


from matplotlib.dates import DateFormatter 

from matplotlib.dates import DayLocator 

from matplotlib.dates import MonthLocator 

from matplotlib.finance import quotes historical yahoo 
from matplotlib.finance import candlestick 

import sys 

from datetime import date 

import matplotlib.pyplot as plt 

today date.today() 

Start (today.year - 1, today.month, today.day) 


(2) 我 们 需要 创建 所 谓 的 定位 器 (locator )， 这 些 来 自 matplot1lib.dates 包 中 的 对 象 可 以 在 
x 轴 上 定位 月 份 和 日 期 。 











alldays = DayLocator () 
months = MonthLocator() 


(3) 创建 一 个 日 期 格式 化 器 〈date formatter ) 以 格式 化 x 轴 上 的 日 期 。 该 格式 化 器 将 创 人 
字符 串 ， 包 含 简写 的 月 份 和 年 份 。 


month_ formatter = DateFormatter("%b %Y") 
(4) 从 雅虎 财经 频道 下 载 股 价 数 据 。 


Guotes = quotes historical yahoo(symbol, start, today) 





人 
全 
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(5) 创建 一 个 Matplotlib 的 figure 对 象 一 一 这 是 绘图 组 件 的 顶层 容器 。 

fig = plt.figure() 

(6) 增加 一 个 子 图 。 

ax = fig.add_ subplot(111) 

(7) 将 x 轴 上 的 主 定位 器 设置 为 月 定位 器 。 该 定位 器 负责 x* 轴 上 较 粗 的 刻度 。 

ax.Xaxis.set_major_ locator (months ) 

(8) 将 x 轴 上 的 次 定位 器 设置 为 日 定位 器 。 该 定位 器 负责 x* 轴 上 较 细 的 刻度 。 

ax.xaxis.set minor_ locator (alldays) 

(9) 将 x 轴 上 的 主格 式 化 器 设置 为 月 格式 化 器 。 该 格式 化 需 负 责 x* 轴 上 较 粗 刻度 的 标签 。 

ax.xaxis.set major_ formatter (month formatter) 

(10)matplotlib.finance 包 中 的 一 个 函数 可 以 绘制 K 线 图 。 这 样 , 我 们 就 可 以 使 用 获取 的 
股价 数据 来 绘制 K 线 图 。 我 们 可 以 指定 K 线 图 的 矩形 宽度 ， 现 在 先 使 用 默认 值 。 

candlestick(ax, quotes) 

(11) 将 x 轴 上 的 标签 格式 化 为 日 期 。 为 了 更 好 地 适应 x 轴 的 长 度 ， 标 签 将 被 旋转 。 


fig.autofmt_ xdate() 
plt.show!() 


绘制 DISH (Dish Network 公 司 ) 的 K 线 图 如 下 图 所 示 。 
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刚才 做 了 些 什么 


我 们 从 雅虎 财经 频道 下 载 了 某 股票 的 全 年 股价 数据 ， 并 据 此 绘制 了 K 线 图 。 示 例 代码 见 
candlesticks.py 文 件 。 




















from matplotlib.dates import DateFormatter 

from matplotlib.dates import DayLocator 

from matplotlib.dates import MonthLocator 

from matplotlib.finance import quotes_ historical yahoo 
from matplotlib.finance import candlestick 

import sys 

from datetime import date 

import matplotlib.pyplot as plt 





today = date.today() 
start = (today.year - 1, today.month, today.day) 


alldays = DayLocator () 
months = MonthLocator () 
month_ formatter = DateFormatter("%b %Y") 


Symbol = 'DISH' 


if len(sys.argv) == 2: 
Symbol = sys.argv[1] 


Guotes = quotes historical yahoo(symbol, start, today) 


fiY 三: BLt. figuret) 

ax = fig.add _ subplot(111) 

ax.xaxis.set major_locator (months) 
ax.xaxis.set minor_locator(alldays) 
ax.xaxis.set_ major_formatter (month_ formatter) 


candlestick(ax, quotes) 


fig.autofmt_ xdate() 
plt.show!() 


9.9 直方 图 


直方 图 (histogram ) 可 以 将 数据 的 分 布 可 视 化 。Matplotlib 中 有 便捷 的 hist 函 数 可 以 绘制 直 
方 图 。 该 函数 的 参数 中 有 这 样 两 项 一 一 包含 数据 的 数组 以 及 柱 形 的 数量 。 














9.10 ”动手 实践 : 绘制 股价 分 布 直方 图 
我 们 来 绘制 从 雅虎 财经 频道 下 载 的 股价 数据 的 分 布 直 方 图 。 
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(1) 下 载 一 年 以 来 的 数据 : 


today = date.today() 
start = (today.year - 1, today.month, today.day) 


quotes = quotes historical yahoo(symbol, start, today) 
(2) 上 一 步 得 到 的 股价 数据 存储 在 Python 列表 中 。 将 其 转化 为 NumPy 数 组 并 提取 出 收盘 价 
数据 : 


quotes = np.array (quotes) 
close = quotes.T[4] 


(3) 指定 合理 数量 的 柱 形 ， 绘 制 分 布 直 方 图 : 











plt.hist(close, np.sqrt (len(close))) 
plt.show!() 


DISH 收 盘 价 的 分 布 直方 图 如 下 图 所 示 。 











35 T T 




















刚才 做 了 些 什么 
我 们 绘制 了 DISH 股 价 的 分 布 直方 图 。 示 例 代 码 见 stockhistogram.py 文 件 。 





from matplotlib.finance import quotes historical yahoo 
import sys 
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from datetime import date 
import matplotlib.pyplot as plt 
import numpy as np 


today = date.today() 

start = (today.year - 1, today.month, today.day) 
Symbol = 'DISH' 

if len(sys.argv) == 2: 


Symbol = sys.argv[1] 


Guotes quotes_historical yahoo(symbol, start, today) 
quotes np.array (quotes) 
close = quotes.T[4] 


plt.hist(close, np.sqgqrt(len(close))) 
plt.show!() 


勇敢 出 发 :绘制 钟 形 曲线 


使 用 股价 的 平均 值 结合 标准 差 绘 制 一 条 钟 形 曲线 ( 即 高 斯 分 布 或 正 态 分 布 )。 当 然 ， 这 只 
是 作为 练习 。 





9.11 对 数 坐 标 图 


当 数 据 的 变化 范围 很 大 时 ,对 数 坐 标 图 ( logarithmic plot ) 很 有 用 。Matplotlib 中 有 semi logx 
函数 ( 对 x 轴 取 对 数 )、semilogy 图 数 ( 对 y 轴 取 对 数 ) 和 1oglog 函 数 〈 同 时 对 x 轴 和 7 轴 取 
对 数 )。 














9.12 ”动手 实践 : 绘制 股票 成 交 量 

股票 成 交 量 变化 很 大 ， 因 此 我 们 需要 对 其 取 对 数 后 再 绘制 。 首 先 ， 我 们 需要 从 雅虎 财经 
频道 下 载 历史 数据 ， 从 中 提取 出 日 期 和 成 交 量 数据 ， 创 建 定 位 器 和 日 期 格式 化 器 ， 创 建 图 像 
并 以 子 图 的 方式 添加 。 在 前 面 的 “动手 实践 ”教程 中 我 们 已 经 完成 过 这 些 步骤 ， 因 此 这 里 不 
再 费 述 。 

(1) 使 用 对 数 坐 标 绘制 成 交 量 数据 。 

plt.semilogy(dates, volume) 


现在 ， 我 们 将 设置 定位 器 并 将 x 轴 格式 化 为 日 期 。 你 可 以 在 前 一 节 中 找到 这 些 步骤 的 说 明 。 
使 用 对 数 坐标 图 绘制 的 DISH 股 票 成 交 量 如 下 图 所 示 。 
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刚才 做 了 些 什么 
我 们 绘制 了 股票 成 交 量 的 对 数 坐 标 图 。 示 例 代码 见 logypy 文 件 。 


from matplotlib.finance import cuotes_historical_yahoo 
from matplotlib.dates import DateFormatter 

from matplotlib.dates import DayLocator 

from matplotlib.dates import MonthLocator 

import sys 

from datetime import date 

import matplotlib.pyplot as plt 

import numpy as np 


today date.today () 
start = (today.year - 1, today.month, today.day) 


Symbol = 'DISH' 


if len(sys.argv) == 2: 
Symbol = sys.argv[1] 


dquotes = quotes_ historical yahoo(symbol, start, today) 
quotes np.array (quotes) 

dates = quotes.T[0] 

volume = quotes.T[5] 


alldays = DayLocator () 
months = MonthLocator () 
month_ formatter = DateFormatter("%b %Y") 


Fig = BIt Figurel() 
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ax = fig.add subplot(111) 

plt.semilogy(dates, volume) 

ax.xaxis.set major_locator (months) 
ax.xaxis.set minor_ locator(alldays) 
ax.xaxis.set_ major_formatter (month formatter) 
fig.autofmt_ xdate() 

plt.show 


9.13” 散 点 图 


散 点 图 ( scatter plot ) 用 于 绘制 同一 数据 集中 的 两 种 数值 变量 。Matplotlib 的 scattezr 函 数 可 
以 创建 散 点 图 。 我 们 可 以 指定 数据 点 的 颜色 和 大 小 ， 以 及 图 像 的 alpha 透 明度 。 








9.14 ”动手 实践 : 绘制 股票 收益 率 和 成 交 量变 化 的 散 点 图 


我 们 可 以 便捷 地 绘制 股票 收益 率 和 成 交 量变 化 的 散 点 图 。 同样 , 我 们 先 从 雅虎 财经 频道 下 载 
所 需 的 数据 。 
(1) 得 到 的 suotes 数 据 存储 在 Python 列表 中 。 将 其 转化 为 NumPy 数 组 并 提取 出 收盘 价 和 成 交 


dates = quotes.T[4] 
volume = quotes.T[5] 


(2) 计算 股票 收益 率 和 成 交 量 的 变化 值 。 





ret = np.diff(close)/close[:-1] 
volchange = np.diff (volume) /volume[:-1] 


(3) 创建 一 个 Matplotlib 的 figure 对 象 。 
fig = pyplot.figure!() 


(4) 在 图 像 中 添加 一 个 子 图 。 





ax = fig.add subplot(111) 9 
(5) 创建 散 点 图 ， 并 使 得 数据 点 的 颜色 与 股票 收益 率 相关 联 ， 数 据点 的 大 小 与 成 交 量 的 变化 

相关 联 。 
ax.scatter(ret, volchange, c=ret * 100, s=volchange * 100, alpha=0.5) 


(6) 设置 图 像 的 标题 并 添加 网 格 线 。 


ax.set_title('Close and volume returns') 
ax.grid(True) 
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pyplot.show!() 


DISH 的 散 点 图 如 下 所 示 。 





Close and volume returns 
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刚才 做 了 些 什 么 


我 们 绘制 了 DISH 的 股票 收益 率 和 成 交 量 变化 的 散 点 图 。 示 例 代 人 码 见 scatterprice.py 文 件 。 


from matplotlib.finance import quotes historical yahoo 
import sys 

from datetime import date 

import matplotlib.pyplot as plt 

import numpy as np 


today = date.today() 


start = (today.year - 1, today.month, today.day) 
Symbol = "DISH' 
If len(sys.argv) == 2: 


Symbol = sys.argv[1] 
quotes = quotes historical yahoo(symbol, start, today) 
quotes = np.array (quotes) 
close = quotes.T[4] 
volume = quotes.T[5] 
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ret = np.diff(close)/close[:-1] 

volchange = np.diff (volume)/volume[:-1] 

fig = plt.figure() 

ax = fig.add _ subplot(111) 

ax.scatter(ret, volchange, c=ret * 100, s=volchange * 100, alpha=0.5) 
ax.set_title('Close and volume returns') 

ax.grid(True) 


plt.show!() 


9.15 着 色 


fi11_between 函 数 使 用 指定 的 颜色 填充 图 像 中 的 区 域 。 我 们 也 可 以 选择 alpha 通 道 的 取 值 。 
该 函数 的 where 参 数 可 以 指定 着 色 的 条 件 。 





9.16 ”动手 实践 : 根据 条 件 进行 着 色 


假设 你 想 对 股票 曲线 图 进行 着 色 ， 并 将 低 于 均值 和 高 于 均值 的 收盘 价 填充 为 不 同 颜 色 。 
fi11_between 函 数 是 完成 这 项 工作 的 最 佳 选择 。 我 们 仍 将 省 略 下 载 一 年 以 来 历史 数据 、 提 取 日 
期 和 收盘 价 数据 以 及 创建 定位 器 和 日 期 格式 化 器 的 步骤 。 


(1) 创建 一 个 Matplotlib 的 figure 对 象 。 





fig = plt. figure() 
(2) 在 图 像 中 添加 一 个 子 图 。 
ax = fig.add _ subplot(111) 


(3) 绘制 收盘 价 数据 。 





ax.plot (dates, close) 


(4) 对 收盘 价 下 方 的 区 域 进行 着 色 ， 依 据 低 于 或 高 于 平均 收盘 价 使 用 不 同 的 颜色 填充 。 


plt.fill between(dates, close.min(), close, 

where=close>close.mean(), facecolor="green", alpha=0.4) 9 
plt.fill between(dates, close.min(), close, 

where=close<close.mean(), facecolor="red", alpha=0.4) 


现在 ,我 们 将 设置 定位 器 并 将 x 轴 格式 化 为 日 期 ， 从 而 完成 绘制 。 根 据 条 件 进行 着 色 的 DISH 
股价 如 下 图 所 示 。 
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刚才 做 了 些 什么 


我 们 对 股价 图 进行 了 着 色 , 低 于 平均 值 的 收盘 价 使 用 了 一 种 颜色 , 高 于 平均 值 的 收盘 价 使 用 
了 另外 一 种 不 同 的 颜色 。 示 例 代 码 见 fillbetween.py 文 件 。 


from matplotlib.finance import cuotes_historical_yahoo 
from matplotlib.dates import DateFormatter 

from matplotlib.dates import DayLocator 

from matplotlib.dates import MonthLocator 

import sys 

from datetime import date 

import matplotlib.pyplot as plt 

import numpy as np 


today date.today () 
start = (today.year - 1, today.month, today.day) 


Symbol = 'DISH' 


If len(sys.argv) == 2: 
Symbol = Sys.argvl1] 


quotes = quotes historical yahoo(symbol, start, today) 
quotes np.array (quotes) 

dates = quotes.T[0] 

close = quotes.T[4] 





alldays = DayLocator () 
months = MonthLocator () 
month_ formatter = DateFormatter("%b %Y") 


fig 三 Blt £1igqurel) 
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ax = fig.add _ subplot(111) 
ax.plot(dates, close) 


plt.fill between(dates, close.min(), close, where=close>close.mean(), facecolor="green", 
alpha=0 .4) 
plt.fill between(dates, close.min(), close, where=close<close.mean(), 


facecolor="red", alpha=0.4) 

ax.xaxis.set major_locator (months) 
ax.xaxis.set minor_ locator(alldays) 
ax.xaxis.set_ major_formatter (month_ formatter) 
ax.grid(True) 

fig.autofmt_ xdate!() 

plt.show!() 


9.17 图例 和 注释 


对 于 高 质量 的 绘图 ， 图 例 和 注释 是 至 关 重 要 的 。 我 们 可 以 用 legend 函 数 创建 透明 的 图 例 ， 
并 由 Matplottib 自动 确定 其 摆 放 位 置 。 同时 , 我 们 可 以 用 annotate 函 数 在 图 像 上 精确 地 添加 注释 ， 
并 有 很 多 可 选 的 注释 和 箭头 风格 。 





9.18 动手 实践 : 使 用 图 例 和 注释 


在 第 3 章 中 我 们 学 习 了 如 何 计算 股价 的 指数 移动 平均 线 。 我 们 将 绘制 一 只 股票 的 收盘 价 和 对 
的 三 条 指数 移动 平均 线 。 为 了 清楚 地 描述 图 像 的 含义 ,我 们 将 添加 一 个 图 例 , 并 用 注释 标明 两 
er il 


(1) 计算 并 绘制 指数 移动 平均 线 : 如 果 需 要 , 请 回 到 第 3 章 中 复习 一 下 指数 移动 平均 线 的 计算 
方法 。 分 别 使 用 9 、12 和 15 作 为 周期 数 计算 和 绘制 指数 移动 平均 线 。 


emas = [] 

for i in range(9, 18, 3): 
weights = np.exp(np.linspace(-1., 0., i)) 
weights /= weights.sum() 
ema = np.convolve (weights, close) [i-1:-i+1] 
idx = (i - 6)/3 





ax.plot(dates[i-1:], ema, lw=idx, label="EMA(%s)" % (i)) 
data = np.column stack( (dates[i-1:], ema)) 
emas.append (np .rec.fromrecords ( data, names=["dates", "ema"])) 





主意 ， 调 用 plot 孙 数 时 需要 指定 图 例 的 标签 。 我 们 将 指数 移动 平均 线 的 值 存在 数组 中 ， 为 
es 
(2) 我 们 来 找到 两 条 指数 移动 平均 曲线 的 交点 。 
first = emas[0]["ema"] .flatten!() 
second = emas[l1l]["ema"] .flatten() 


bools = np.abs (first[-len(second):] - second)/second < 0.0001 
xpoints = np.compress (bools, emas[1]) 
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(3) 我 们 将 找到 的 交点 用 注释 和 箭头 标注 出 来 ， 并 确保 注释 文本 在 交点 的 不 远 处 。 
for xBboint 工人 DOES: 
ax.annotate('x', xy=xpoint, textcoords='offset points', 


xytext=(-50, 30), 
arrowprops=dict (arrowstyle="->")) 


(4) 添加 一 个 图 例 并 由 Matplotlib 自 动 确定 其 摆 放 位 置 。 
leg = ax.legend(loc='best', fancybox=True) 

(5) 设置 alpha 通 道 值 ， 将 图 例 透 明 化 。 

leg.get_ frame().set _ alpha(0.5) 


包含 图 例 和 注释 的 股价 及 指数 移动 平均 线 图 如 下 所 示 。 











-一 EMA(9) 
一 EMA(12) 
48|| — EMA(15) 























刚才 做 了 些 什么 


我 们 绘制 了 股票 收盘 价 和 对 应 的 三 条 指数 移动 平均 线 。 我 们 添加 了 一 个 图 例 , 并 使 用 注释 将 
其 中 两 条 曲线 的 交点 标注 了 出 来 。 示 例 代码 见 emalegend.py 文 件 。 


from matplotlib.finance import quotes historical yahoo 
from matplotlib.dates import DateFormatter 

from matplotlib.dates import DayLocator 

from matplotlib.dates import MonthLocator 

import sys 

from datetime import date 

import matplotlib.pyplot as plt 

import numpy as np 


today = date.today() 
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start = (today.year - 1, today.month, today.day) 
Symbol = 'DISH' 


if len(sys.argv) == 
Symbol = Sys argv[l1] 
Guotes = quotes historical yahoo(symbol, start, today) 
quotes = np.array (quotes) 
dates = quotes.T[0] 
close = quotes.T[4] 


fig = plt.figure() 
ax = fig.add subplot(111) 


emas = [] 

for i in range(9, 18, 3): 
weights = np.exp(np.linspace(-1., 0., i)) 
weights / = weights.sum() 


ema = np.convolve (weights, close) [i-1:-i+1] 
idx = (i - 6)/3 


ax.plot (dates[i-1:], ema, lw=idx, label="EMA(%s)" % (i)) 
data = np.column stack( (dates[i-1:], ema)) 
emas .append (np .rec.fromrecords (data, names=["dates", "ema"])) 


first = emas[0]["ema"].flatten() 

second = emas[1]["ema"].flatten() 

bools = np.abs (first[-len(second):] - second)/second < 0.0001 
xpoints = np.compress (bools, emas[1]) 


for xpoint in xpoints: 
ax.annotate('x', xy=xpoint, textcoords='offset points', 
xytext=(-50, 30), 
arrowprops=dict (arrowstyle="->")) 


leg = ax.legend(loc='best', fancybox=True) 
leg.get_frame().set_alpha(0.5) 


alldays = DayLocator () 

months = MonthLocator () 

month_ formatter = DateFormatter("%b %Y") 
ax.plot(dates, close, lw=1.0, label="Close") 
ax.xaxis.set _ major_locator (months) 
ax.xaxis.set minor_ locator(alldays) 
ax.xaxis.set major_formatter (month_ formatter) 
ax.grid (True) 

fig.autofmt xdate() 

plt.show!() 





9.19 ”三 维 绘图 
三 维 绘图 非常 壮观 华丽 ， 因 此 我 们 必须 涵盖 这 部 分 内 容 。 对 于 3D 作 图 ， 我 们 需要 一 个 和 三 
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维 投影 相关 的 Axes3D 对 象 。 


9.20 动手 实践 : 在 三 维 空间 中 绘图 
我 们 将 在 三 维 空间 中 绘制 一 个 简单 的 三 维 函 数 。 








2 
Z=X =y 


(1) 我 们 需要 使 用 3d 关 键 字 来 指定 图 像 的 三 维 投影 。 
ax = fig.add subplot(111, projection='3d') 


(2) 我 们 将 使 用 mesnhgrid 函 数 创建 一 个 二 维 的 坐标 网 格 。 这 将 用 于 变量 x 和 y 的 赋值 。 








u = np.linspace(-1, 1, 100) 


x, y = np.meshgrid(u, u) 


(3) 我 们 将 指定 行 和 列 的 步 幅 , 以 及 绘制 曲面 所 用 的 色彩 表 ( color map ), 步 幅 决定 曲面 上 “ 瓦 
片 ”的 大 小 ， 而 色彩 表 的 选择 取决 于 个 人 喜好 。 


ax.plot_surface(x, y, 2z, rstride=4, cstride=4, cmap=cm.YlGnBu_r) 


3D 绘 图 的 结果 如 下 所 示 。 























刚才 做 了 些 什 么 
我 们 绘制 了 一 个 三 维 空间 中 的 函数 。 示 例 代码 见 three_d.py 文 件 。 
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from mp1_toolkits.mplot3d import Axes3D 
import matplotlib.pyplot as plt 

import numpy as np 

from matplotlib import cm 


fig = Plt. figurel() 
ax = fig.add subplot(111, projection='3d') 


u = np.linspace(-1, 1, 100) 
x, y = np.meshgrid(u, u) 
区 


ax.plot_surface(x, y, 2z, rstride=4, cstride=4, cmap=cm.YlGnBu _r) 


plt.show!() 


9.21 等 高 线 图 


Matplotlib 中 的 等 高 线 3D 绘 图 有 两 种 风格 一 一 填充 的 和 非 填 充 的 。 我 们 可 以 使 用 contour 画 
数 创建 一 般 的 等 高 线 图 。 对 于 色彩 填充 的 等 高 线 图 ， 可 以 使 用 contourf 绘 制 。 








9.22 ”动手 实践 : 绘制 色彩 填充 的 等 高 线 图 


我 们 将 对 前 面 “ 动 手 实践 ”中 的 三 维 数学 函数 绘制 色彩 填充 的 等 高 线 图 。 代 码 也 非常 简单 ， 
一 个 重要 的 区 别 是 我 们 不 再 需要 指定 三 维 投影 的 参数 。 使 用 下 面 这 行 代码 绘制 等 高 线 图 : 























ax.contourf (x, y, 2Z) 


输出 结果 如 下 图 所 示 。 
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刚才 做 了 些 什么 
我 们 对 一 个 三 维 数学 函数 绘制 了 色彩 填充 的 等 高 线 图 。 示 例 代码 见 contour.py 文 件 。 


import matplotlib.pyplot as plt 
import numpy as np 


from matplotlib import cm 


fig = plt.figure!() 
ax = fig.add subplot(111) 


u = np.linspace(-1, 1, 100) 
x, y = np.meshgrid(u, u) 
-ee 


ax.contourf (x, y, 2zZ) 


plt.show!() 


9.23 动画 


Matplotlib 提 供 酷 炫 的 动画 功能 。Matplotlib 中 有 专门 的 动画 模块 。 我 们 需要 定义 一 个 回调 画 
数 ， 用 于 定期 更 新 屏幕 上 的 内 容 。 我 们 还 需要 一 个 函数 来 生成 图 中 的 数据 点 。 











9.24 动手 实践 : 制作 动画 


我 们 将 绘制 三 个 随机 生成 的 数据 集 ， 分 别 用 圆 形 、 小 圆 点 和 三 角形 来 显示 。 不 过 , 我 们 将 只 
用 随机 值 更 新 其 中 的 两 个 数据 集 。 


(1) 我 们 将 用 不 同 颜色 的 圆 形 、 小 圆 点 和 三 角形 来 绘制 三 个 数据 集中 的 数据 点 。 





Cirelegs, triangles, dots = axBlot (x, ro YY, og*', BZ, Tb, ") 


(2) 下 面 的 函数 将 被 定期 调用 以 更 新 屏幕 上 的 内 容 。 我 们 将 随机 更 新 两 个 数据 集中 的 y 坐 
标 值 。 
def update(data): 
circles.set ydata(data[0]) 


triangles.set_ ydata(data[1]) 
return circles, triangles 


(3) 使 用 NumPy 生 成 随机 数 。 











def generate() : 
while True: yield np.random.rand(2, N) 


以 下 是 生成 的 动画 的 截图 。 
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< 











刚才 做 了 些 什么 


我 们 使 用 随机 数据 点 制作 了 一 个 动画 。 示 例 代码 见 animation.py 文 件 。 





import numpy as np 
import matplotlib.pyplot as plt 
import matplotlib.animation as animation 


fig = plt.figure() 


ax = fig.add _ subplot(111) 
N's 10 
x = np.random.rand(N) 
y = np.random.rand(N) 
z = np.random.rand(N) 
Circles, triangles, dots = axpBlot(x; "ro', YyY, "gg*", 
ax.set_ ylim(0, 1) 
plt.axis('off') 
def update(data): 
circles.set ydata(data[0]) 
triangles.set ydata(data[l1]) 
return circles, triangles 
def generated: 
while True: yield np.random.rand(2, N) 
anim = animation.FuncAnimation(fig, update, generate, 


plt.show!() 
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interval=150) 
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9.25 本章 小 结 


本 章 赎 绕 Matplotlib 一 一 一 个 Python 绘 图 库 展开 ,涵盖 简单 绘图 、 直 方 图 、 定 制 绘图 、 子 图 、 
3D 绘 图 、 等 高 线 图 和 对 数 坐标 图 等 内 容 。 我 们 还 学 习 了 几 个 绘制 股票 数据 的 例子 。 显 然 ， 我 们 
还 只 是 领略 了 冰山 一 角 。Matplotlib 的 功能 非常 丰富 , 因此 我 们 没有 足够 的 篇 幅 来 讲述 LaTex 支 持 、 
极 坐 标 支持 以 及 其 他 功能 。 


Matplotlib 的 作者 John Hunter 于 2012 年 8 月 离开 了 我 们 。 本 书 的 审 稿 人 之 一 建议 在 此 提 及 John 
Hunter 纪 念 基 金 (John Hunter Memorial Fund， 请 访问 http:/numfocus.org/johnhunter )。 该 基金 由 
NumFocus Foundation 发 起 , 可 以 这 么 说 , 它 给 了 我 们 这 些 John Hunter 作 品 的 粉丝 们 一 个 回报 的 机 
会 。 更 多 详情 ， 请 访问 前 面 的 NumFocus 网 站 链接 。 


下 一 章 中 ， 我 们 将 学 习 SciPy 一 一 一 个 建立 在 NumPy 之 上 的 Python 科学 计算 架构 。 
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NumPy 的 扩展 : SciPy 








SciPy 是 世界 著名 的 Python 开源 科学 计算 库 ， 建 立 在 NumPy 之 上 。 它 增加 
的 功能 包括 数值 积分 、 最 优化 、 统 计 和 一 些 专用 函数 。 


章 涵盖 以 下 内 容 ; 


口 文件 输入 /输出 ; 
口 统计 ; 

口 信号 处 理 ; 

口 最 优化 ; 

口 插值 ; 

口 图 像 和 音频 处 理 。 





10.1 MATLAB 和 Octave 


MATLAB 以 及 其 开源 替代 品 Octave 都 是 


流行 的 数学 工具 。scipy .io 包 的 也 数 可 以 在 Python 


中 加 载 或 保存 MATLAB 和 Octave 的 和 矩阵 和 数组 。1oagdmat 卫 数 可 以 加 载 .mat 文 件 。savemat 了 所 
数 可 以 将 数组 和 指定 的 变量 名 字典 保存 为 .mat 文 件 。 


10.2 ”动手 实践 : 保存 和 加 载 .mat 文件 


如 果 我 们 一 开始 使 用 了 NumPy 数 组 , 随后 希望 在 MATLAB 或 Octave 环 境 中 使 用 这 些 数 组 , 那 
么 最 简单 的 办 法 就 是 创建 一 个 .mat 文件 ， 然 后 在 MATLAB 或 Octave 中 加 载 这 个 文件 。 请 完成 如 


下 步骤 。 


(1) 创建 NumPy 数 组 并 调用 savemat 创 到 
和 一 个 包含 变量 名 和 取 值 的 字典 。 





一 个 .mat 文 件 。 该 函数 有 两 个 参数 一 一 个 文件 名 
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a = np.arange(7) 


io.savemat ("a.mat"，{"arravy": a}) 


(2) 在 MATLAB 或 Octave 环 境 中 加 载 .mat 文 件 ， 并 检查 数组 中 存储 的 元 素 。 

















octave-3.4.0:7> load a.mat 
octave-3.4.0:8> a 


octave-3.4.0:8> array 
array = 


OAUUPROWVD OPO 


刚才 做 了 些 什么 








我 们 使 用 NumPy 代 码 创 建 了 一 个 .mat 文 件 并 在 Octave 中 成 功 加 载 。 我 们 检查 了 之 前 创建 的 
NumPy 数 组 的 元 素 。 示 例 代 码 见 scipyio.py 文 件 。 





import numpy as np 
from scipy import io 


a = np.arange(7) 


io.savemat ("a.mat", f{"array": a}) 


突击 测验 :加 载 .mat 类 型 的 文件 





问题 1 以 下 哪个 函数 可 以 加 载 .mat 类 型 的 文件 ? 
(1) Loadmatlab 

(2) 1oadmat 

(3) lo0adoct 

(4) frommat 





10.3 统计 


SciPy 的 统计 模块 是 scipy .stats， 其 中 有 一 个 类 是 连续 分 布 的 实现 ， 一 个 类 是 离散 分 布 的 
实现 。 此 外 ， 该 模块 中 还 有 很 多 用 于 统计 检验 的 函数 。 
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10.4 ”动手 实践 : 分 析 随 机 数 

我 们 将 按 正 态 分 布 生成 随机 数 ， 并 使 用 scipy.stats 包 中 的 统计 函数 分 析 生成 的 数据 。 请 
完成 如 下 步骤。 

(1) 使 用 scipy.stats 包 按 正 态 分 布 生成 随机 数 。 

generated = stats.norm.rvs (size=900) 

(2) 用 正 态 分 布 去 拟 合生 成 的 数据 ， 得 到 其 均值 和 标准 差 : 

print "Mean", "Std", stats.norm.fit(generated) 

均值 和 标准 差 如 下 所 示 : 

Mean Stqd (0.0071293257063200707, 0.95537708218972528) 


(3) 偏 度 ( skewness ) 描述 的 是 概率 分 布 的 偏 斜 ( 非 对 称 ) 程度 。 我 们 来 做 一 个 偏 度 检验 。 
该 检验 有 两 个 返回 值 ， 其 中 第 二 个 返回 值 为 p-value， 即 观察 到 的 数据 集 服从 正 态 分 布 的 概率 , 取 
值 范围 为 0~1。 


print "Skewtest", "pvalue", stats.skewtest (generated) 
偏 度 检 验 返 回 的 结果 如 下 : 

Skewtest pvalue (-0.62120640688766893, 0.5344638245033837) 
因此 ， 该 数据 集 有 53% 的 概率 服从 正 态 分 布 。 


(4) 峰 度 kurtosis ) 描述 的 是 概率 分 布 有 曲线 的 陡峭 程度 。 我 们 来 做 一 个 峰 度 检验 。 该 检验 与 
剖 度 检验 类 似 ， 当 然 这 里 是 针对 峰 度 。 























print "Kurtosistest", "pvalue", stats.kurtosistest (generated) 
条 度 检验 返回 的 结果 如 下 : 
Kurtosistest pvalue (1.306538101953 6981, 0.19136963054975586) 


(5) 正 态 性 检验 (normality test ) 可 以 检查 数据 集 服从 正 态 分 布 的 程度 。 我 们 来 做 一 个 正 态 性 
检验 。 该 检验 同样 有 两 个 返回 值 ， 其 中 第 二 个 返回 值 为 p-value。 


一 








print "Normaltest", "pvalue", stats.normaltest (generated) 


正 态 性 检验 返回 的 结果 如 下 : 








Normaltest pvalue (2.09293921181506, 0.35117535059841687) 


(6) 使 用 SciPy 我 们 可 以 很 方便 地 得 到 数据 所 在 的 区 段 中 某 一 百分比 处 的 数值 : 
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print "95 percentile", stats.scoreatpercentile(generated, 95) 
得 到 95% 处 的 数值 如 下 : 

95 percentile 1.54048860252 

(7) 将 前 一 步 反 过 来 ， 我 们 也 可 以 从 数值 1 出 发 找到 对 应 的 百分比 : 
print "Percentile at 1", stats.percentileofscore(generated, 1) 
得 到 对 应 的 百分比 如 下 : 

Percentile at 1 85.5555555556 


(8) 使 用 Matplotlib 绘 制 生 成 数据 的 分 布 直方 图 。 有 关 Matplotlib 的 详细 介绍 可 以 在 前 一 章 中 
找到 。 


plt.hist (generated) 
plt.show!() 


生成 随机 数 的 直方 图 如 下 所 示 。 
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刚才 做 了 些 什么 


我 们 按 正 态 分 布 生 成 了 一 个 随机 数据 集 ， 并 使 用 scipy .stats 模 块 分 析 了 该 数据 集 。 示 例 
代码 见 statistics.py 文 件 。 





from scipy import stats 
import matplotlib.pyplot as plt 
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generated = stats.norm.rvs (size=900) 


print "Mean", "Std", stats.norm.fit(generated) 

print "Skewtest", "pvalue", stats.skewtest (generated) 

print "Kurtosistest", "pvalue", stats.kurtosistest (generated) 
print "Normaltest", "pvalue", stats.normaltest (generated) 


print "95 percentile", stats.scoreatpercentile(generated, 95) 
print "Percentile at 1", stats.percentileofscore(generated, 1) 
plt.hist (generated) 

plt.show!() 


勇敢 出 发 : 改进 数据 生成 


从 本 节 中 的 直方 图 来 看 ， 数 据 生 成 仍 有 改进 的 空间 。 尝 试 使 用 NumPy 或 调节 scipy.stats . 


norm.rVs 函 数 的 参数 。 





10.5 ”样本 比 对 和 SciKits 


我 们 经 常会 遇 到 两 组 数据 样本 , 它们 可 能 来 自 不 同 的 实验 , 但 互相 有 一 些 关联 。 统计 检验 可 
以 进行 样本 比 对 。scipy.stats 模 块 中 已 经 实现 了 部 分 统计 检验 。 








男 一 种 笔者 喜欢 的 统计 检验 是 scikits.statsmodels.stattools 中 的 Jarque-Bera 正 态 性 
检验 。SciKits 是 Python 的 小 型 实验 工具 包 , 它 并 不 是 SciPy 的 一 部 分 。 此 外 还 有 pandas( Python Data 
Analysis Library )， 它 是 scikits.statsmodels 的 分 支 。 你 可 以 访问 https://scikits.appspot. 
com/scikits 查 阅 SciKits 的 模块 索引 。 你 可 以 使 用 setuptools 安 装 statsmodels， 命令 如 下 : 
































easy_install statsmodels 


10.6 ”动手 实践 : 比较 股票 对 数 收益 率 


我 们 将 使 用 Matplotlib 下 载 一 年 以 来 的 两 只 股票 的 数据 。 如 同 前 面 的 章节 中 所 述 ， 我 们 可 以 
从 雅虎 财经 频道 获取 股价 数据 。 我 们 将 比较 DIA 和 SPY 收 盘 价 的 对 数 收益 率 。 我 们 还 将 在 两 只 股 
票 对 数 收益 率 的 差 值 上 应 用 Jarque-Bera 正 态 性 检验 。 请 完成 如 下 步骤 。 

(1) 编写 一 个 函数 ， 用 于 返回 指定 股票 的 收盘 价 数据 。 

def get_close(symbol): 


today = date.today() 
start = (today.year - 1, today.month, today.day) 






































quotes 
quotes 


quotes_historical yahoo(symbol, start, today) 
np.array (quotes) 
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return quotes.T[4] 


(2) 计算 DIA 和 SPY 的 对 数 收 益 率 。 先 对 收盘 价 取 自然 对 数 , 然后 计算 连续 值 之 间 的 差 值 ， 即 
得 到 对 数 收益 率 。 

spy 

dia 

(3) 均值 检验 可 以 检查 两 组 不 同 的 样本 是 否 有 相同 的 均值 。 返 回 值 有 两 个 ， 其 中 第 二 个 为 
p-value， 取 值 范围 为 0~1。 








np.diff (np.log(get_ close("SPY"))) 
np.diff (np.log(get_close("DIA"))) 











print "Means comparison", stats.ttest_ ind(spy, dia) 


均值 检验 的 结果 如 下 : 


Means comparison (-0.017995865641886155, 0.98564930169871368) 
因此 有 98% 的 概率 两 组 样本 对 数 收 益 率 的 均值 相同 。 

(4) Kolmogorov-Smirnov 检 验 可 以 判断 两 组 样本 同 分 布 的 可 能 性 。 
print "Kolmogorov smirnov test", stats.ks 2samp (spy, dia) 


同样 ， 该 函数 有 两 个 返回 值 ， 其 中 第 二 个 为 p-value。 


Kolmogorov smirnov test (0.063492063492063516, 0.67615647616238039) 


(5) 在 两 只 股票 对 数 收益 率 的 差 值 上 应 用 Jarque-Bera 正 态 性 检验 。 
print "Jarque Bera test", jarque bera(spy - dia) [11 
Jarque-Bera 正 态 性 检验 得 到 的 p-value 如 下 : 

Jarque Bera test 0.596125711042 


(6) 使 用 Matplotlib 绘 制 对 数 收 益 率 以 及 其 差 值 的 直方 图 。 





plt.hist(spy, histtype="step", lw=1, label="SPY") 
plt.hist(dia, histtype="step", lw=2, label="DIA") 
plt.hist(spy - dia, histtype="step", lw=3,1label="Delta") 
plt.legend() 
plt.show!() 
绘制 结果 如 下 图 所 示 。 

刚才 做 了 些 什么 


我 们 比较 了 DIA 和 SPY 样 本 数据 的 对 数 收益 率 ， 还 对 它们 的 差 值 应 用 了 Jarque-Bera 正 态 性 检 
验 。 示 例 代 码 见 pairpy 文 件 。 
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from matplotlib.finance import quotes historical yahoo 
from datetime import date 

import numpy as np 

from scipy import stats 

from statsmodels.stats.stattools import jarque_ bera 
import matplotlib.pyplot as plt 


def get_close(symbol): 
today = date.today() 
start = (today.year - 1, today.month, today.day) 


Guotes = quotes historical yahoo(symbol, start, today) 
quotes = np.array (quotes) 


return quotes.T[4] 


spy = np.diff (np.log(get_ close("SPY"))) 
dia = np.diff(np.log(get close("DIA"))) 


print "Means comparison", stats.ttest_ind(spy, dia) 
print "Kolmogorov smirnov test", stats.ks 2samp (spy, dia) 


print "Jarque Bera test", jarque beral(lspy - dia){[1] 





plt.hist(spy, histtype="step", lw=1, label="SPY") 
plt.hist(dia, histtype="step", lw=2, label="DIA") 
plt.hist(spy - dia, histtype="step", lw=3, label="Delta") 
plt.legend() 

plt.show!() 





图 灵 社 区 会 员 heruihong 专 享 尊重 版 权 


190 第 10 章 NumPy 的 扩展 : SciPy 





10.7 ”信号 处 理 


scipy .signal 模 块 中 包含 滤波 函数 和 B 样 条 插值 ( B-spline interpolation ) 函数 。 





逐 和 样 条 插值 使 用 称 为 样 条 的 多 项 式 进行 插值 .插值 过 程 将 分 段 多 项 式 连 接 起 来 
拟 合 数据 。B 样 条 是 样 条 的 一 种 类 型 


SciPy 中 以 一 组 数值 来 定义 信号 。 我 们 以 aetrena 函 数 作为 滤波 需 的 一 个 例子 。 该 函数 可 以 
对 信号 进行 线性 拟 合 ， 然 后 从 原始 输入 数据 中 去 除 这 个 线性 趋势 。 





10.8 动手 实践 : 检测 QQQ 股价 的 线性 趋势 


相 比 于 去 除数 据 样本 的 趋势 , 我 们 通常 更 关心 的 是 趋势 本 身 。 在 去 除 趋势 的 操作 之 后 , 我 们 
仍然 很 容易 获取 该 趋势 。 我 们 将 对 QQQ 一 年 以 来 的 股价 数据 进行 这 些 处 理 分 析 。 


(1) 编写 代码 获取 QQQ 的 收盘 价 和 对 应 的 日 期 数据 。 


























today = date.today() 

start = (today.year - 1, today.month, today.day) 
Guotes = quotes historical yahoo("QQ0", start, today) 
dquotes = np.array (quotes) 


dates = quotes.T[0] 
qqq = quotes.T[4] 


(2) 去 除 信 号 中 的 线性 趋势 。 
y = signal.detrend (qqq) 


(3) 创建 月 定位 器 和 日 定位 器 。 





alldays = DayLocator () 
months = MonthLocator () 


(4) 创建 一 个 日 期 格式 化 器 以 格式 化 x 轴 上 的 日 期 。 该 格式 化 器 将 创建 一 个 字符 串 , 包含 简写 
的 月 份 和 年 份 。 


month_ formatter = DateFormatter("%b %Y") 


(5) 创建 图 像 和 子 图 。 





fi = .Blt .figure() 
ax = fig.add subplot(111) 
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(6) 绘制 股价 数据 以 及 将 去 除 趋势 后 的 信号 从 原始 数据 中 减 去 所 得 到 的 潜在 趋势 。 
plt.plot(dates, qqq, 'o0o', dates, qqq - y, '-') 
(0) 设置 定位 器 和 格式 化 器 。 


ax.xaxis.set minor_locator(alldays) 
ax.xaxis.set major_locator (months) 
ax.xaxis.set_ major_formatter (month_ formatter) 


(8) 将 x 轴 上 的 标签 格式 化 为 日 期 。 


fig.autofmt_ xdate!() 
plt.show!() 


QQQ 的 股价 以 及 趋势 线 如 下 图 所 示 。 
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刚才 做 了 些 什么 
我 们 绘制 了 QQQ 的 收盘 价 数据 以 及 对 应 的 趋势 线 。 示 例 代码 见 trend.py 文 件 。 


From matplotlib.finance import quotes_historical_yahoo 
from datetime import date 
import numpy as np 





from scipy import signal 

import matplotlib.pyplot as plt 

from matplotlib.dates import DateFormatter 
from matplotlib.dates import DayLocator 
from matplotlib.dates import MonthLocator 








today = date.today() 
start = (today.year - 1, today.month, today.day) 
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quotes_historical yahoo("QQ0", start, today) 
np.array (quotes) 


quotes 
quotes 


dates = quotes.T[0] 
qqq = quotes.T[4] 


y = signal.detrend (qqq) 


alldays = DayLocator () 
months = MonthLocator () 
month formatter = DateFormatter("%b %Y") 


fig := PIt. figure'() 
ax = fig.add subplot(111) 


plt.plot(dates, qqq, 'o', dates, qqq - y, '-') 
ax.xaxis.set minor_ locator(alldays) 
ax.xaxis.set_ major_locator (months) 
ax.xaxis.set major_formatter (month_ formatter) 
fig.autofmt_ xdate() 

plt.show!() 


10.9 传 里 时 分 析 





现实 世界 中 的 信和 号 往往 具有 周期 性 。 传 里 叶 变换 (Fourier transform ) 是 处 理 这 些 











信号 的 常 


工具 。 里 叶 变换 是 一 种 从 时 域 到 频 域 的 变换 , 也 就 是 将 周期 信号 线性 分 解 为 不 同 频率 的 正弦 


，。 





傅 里 时 变换 的 因数 可 以 在 scipy.fftpack 模 块 中 找到 (NumPy 也 有 自己 的 传 里 叶 工 具 包 ， 














Bnumpy. fft )。 这 个 模块 包含 快速 傅 里 叶 变 换 、 微 分 算 子 和 拟 微分 算 子 以 及 一 些 辑 








MATLAB 用 户 会 很 高 兴 ， 因 为 scipy.fftpack 模 块 中 的 很 多 函数 与 MATLAB 对 应 的 函 
且 功 能 也 很 相近 





10.10 动手 实践 : 对 去 除 趋 势 后 的 信号 进行 滤波 处 理 


助 函 数 。 
数 同名 ， 


在 10.8 节 我 们 学 习 了 如 何 去 除 信号 中 的 趋势 。 去 除 趋 势 后 的 信号 可 能 有 周期 性 的 分 量 ,， 我 们 
将 其 显现 出 来 。 一 些 步骤 已 在 前 面 的 “动手 实践 ”教程 中 出 现 过 ， 如 下 载 数据 和 设置 Matplotlib 








对 象 。 这 些 步 又 将 被 略 去 。 
(1) 应 用 侍 里 叶 变 换 ， 得 到 信号 的 频谱 。 
amps = np.abs(fftpack.fftshift (fftpack.rfft (y))) 
(2) 滤 除 噪声 。 如 有 果 某 一 频率 分 量 的 大 小 低 于 最 强 分 量 的 10%， 则 将 其 滤 除 。 


amps[amps < 0.1 * amps.max()] = 0 
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(3) 将 滤波 后 的 信号 变换 回 时 域 ， 并 和 去 除 趋 势 后 的 信号 一 起 绘制 出 来 。 


plt.plot(dates, y, 'o', label="detrended") 
plt.plot (dates, -fftpack.irfft(fftpack.ifftshift(amps)), label="filtered") 


(4) 将 x 轴 上 的 标签 格式 化 为 日 期 ， 并 添加 一 个 特大 号 的 图 例 。 


fig.autofmt_ xdate() 
plt.legend (prop={'size':'x-large'}) 


(5) 添加 第 二 个 子 图， 绘制 滤波 后 的 频谱 。 





ax2 = fig.add_ _ subplot (212) 
N = len(qqaq) 
plt.plot (np.linspace(-N/2, N/2, N), amps, label="transformed") 


(6) 显示 图 像 和 图 例 。 
plt.legend (prop={'size':'x-large'}) 
plt.show!() 


绘制 的 信号 和 频谱 如 下 图 所 示 。 
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刚才 做 了 些 什么 





我 们 去 除了 一 个 信和 号 的 趋势 ， 并 使 用 scipy. fftpack 模 块 对 其 应 用 了 一 个 简单 的 滤波 器 。 
示例 代码 见 frequencies.py 文 件 。 





from matplotlib.finance import quotes historical yahoo 
from datetime import date 

import numpy as np 

from scipy import signal 

import matplotlib.pyplot as plt 
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from scipy import fftpack 

from matplotlib.dates import DateFormatter 
from matplotlib.dates import DayLocator 
from matplotlib.dates import MonthLocator 


today date.today () 
start = (today.year - 1, today.month, today.day) 


Guotes = quotes historical yahoo("QQ00", start, today) 
quotes np.array (quotes) 


dates = quotes.T[0] 
qqq = quotes.T[4] 
y = signal.detrend (qqq) 


alldays = DayLocator () 
months = MonthLocator () 
month_ formatter = DateFormatter("%b %Y") 


fig = plt.figure() 
fig.subplots_adjust (hspace=.3) 
ax = fig.add subplot(211) 


ax.xaxis.set minor_ locator(alldays) 
ax.xaxis.set major_locator (months) 
ax.xaxis.set major_formatter (month_ formatter) 


# 调 大 字号 
ax.tick params (axis='both', which='major', labelsize='x-large') 


amps = np.abs (fftpack.fftshift(fftpack.rfft(y))) 
amps[amps < 0.1 * amps.max()] = 0 


plt.plot(dates, y, 'o', label="detrended") 

plt.plot(dates, -fftpack.irfft(fftpack.ifftshift(amps)), label="filtered") 
fig.autofmt_ xdate!() 

plt.legend (prop={'size':'x-large'}) 


ax2 = fig.add_ subplot (212) 

ax2.tick params (axis='both', which='major', labelsize='x-large') 
N = len(qqq) 

plt.plot (np.linspace(-N/2, N/2, N), amps, label="transformed") 


plt.legend (prop={'size':'x-large'}) 
plt.show!() 


10.11 数学 优化 


优化 算法 (optimization algorithm ) 尝试 寻求 某 一 问题 的 最 优 解 ， 例 如 找到 函数 的 最 大 值 或 
最 小 值 ， 函 数 可 以 是 线性 或 者 非 线 性 的 。 解 可 能 有 一 些 特 定 的 约束 ， 例 如 不 允许 有 负数 。 在 
scipy.optimize 模 块 中 提供 了 一 些 优化 算法 , 最 小 二 乘法 函数 leastsq 就 是 其 中 之 一 。 当 调用 
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这 个 函数 时 ,我们 需要 提供 一 个 残 差 ( 误差 项 ) 函数 。 这 样 ，leastsq 将 最 小 化 残 差 的 平方 和 。 
得 到 的 解 与 我 们 使 用 的 数学 模型 有 关 。 我 们 还 需要 为 算法 提供 一 个 起 始点 , 这 应 该 是 一 个 最 好 的 
猜测 一 一 尽 可 能 接近 真实 解 。 否 则 ， 程 序 执行 800 轮 迭代 后 将 停止 。 

















10.12 ”动手 实践 : 拟 合 正弦 波 


在 10.10 节 中 ， 我 们 为 去 除 趋势 后 的 数据 创建 了 一 个 简单 的 滤波 器 。 现 在 ， 我 们 使 用 一 个 限 
制 性 更 强 的 滤波 器 ， 只 保留 主 频率 部 分 。 我 们 将 拟 合 一 个 正弦 波 并 绘制 结果 。 该 模型 有 4 个 参数 一 一 
振幅 、 频 率 、 相 位 和 垂直 偏 移 。 请 完成 如 下 步骤 。 


(1) 根据 正弦 波 模型 ， 


def residuals(p, y, Xx): 
A,k,theta,b = p 
err = y-A * np.sin(2* np.pi* k * x + theta) + b 








霸 


定义 residuals 函 数 : 


return err 


(2) 将 滤波 后 的 信号 变换 回 时 域 : 
filtered = -fftpack.irfft(fftpack.ifftshift (amps)) 


(3) 猜测 参数 的 值 ， 尝 试 估计 从 时 域 到 频 域 的 变换 函数 : 


N = len(qaqaq) 

f = np.linspace(-N/2, N/2, N) 

p0 = [filtered.max(), flamps.argmax()]/(2*N), 0, 0] 
print "PO", p0 

初始 值 如 下 所 示 : 

PO [2.6679532410065212，0.00099598469163686377，0，01] 
(4) 调用 leastsdq 函 数 : 


DlLsda = optimize.leastsq(residuals, p0, args=(filtered,dates)) 
p = plsq[0] 
print "PpP", p 


最 终 的 参数 值 如 下 所 示 : 
P [2.67678014e+00 2.73033206e-03 -8.00007036e+03 -5.01260321e-03] 


(5) 在 第 一 个 子 图 中 绘制 去 除 趋势 后 的 数据 、 滤 波 后 的 数据 及 其 拟 合 曲线 。 将 x 轴 格式 化 为 日 
并 添加 一 个 图 例 。 


plt.plot(dates, y, 'o', label="detrended") 
plt.plot (dates, filtered, label="filtered") 











3 
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plt.plot (dates, p[0] * np.sin(2 * np.pi * dates * pb[1] + Bp[2]) + B[3], '^', label="fit") 
fig.autofmt_ xdate() 
plt.legend (prop={'size':'x-large'}) 


(6) 添加 第 二 个 子 图 ， 绘 制 主 频率 部 分 的 频谱 图 和 图 例 。 


ax2 = fig.add _ subplot (212) 









































plt.plot(f, amps, label="transformed") 
OA 士 元 
绘制 结果 如 下 图 所 示 。 
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刚才 做 了 些 什么 


我 们 对 一 年 以 来 的 QQQ 股 价 数据 进行 了 去 趋势 处 理 。 然 后 进行 了 滤波 处 理 ， 仅 保留 了 频谱 
上 的 主 频 率 部 分 。 我 们 使 用 scipy.optimize 模 块 对 滤波 后 的 信号 拟 合 了 一 个 正弦 波 函 数 。 示 例 
代码 见 optfit py 文件 。 





from matplotlib.finance import quotes historical yahoo 
import numpy as np 

import matplotlib.pyplot as plt 

from scipy import fftpack 

from scipy import signal 

from matplotlib.dates import DateFormatter 

from matplotlib.dates import DayLocator 

from matplotlib.dates import MonthLocator 

from scipy import optimize 


Start, 3 (2010, 7; 25) 
end = (2011, 7; 25) 


dquotes = quotes_ historical yahoo("QQ00", start, end) 
quotes = np.array (quotes) 


dates = quotes.T[0] 
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10. 


qqq = quotes.T[4] 


y = signal.detrend (qqq) 


alldays = DayLocator () 
months = MonthLocator () 
month_ formatter = DateFormatter("%b %Y") 


fig = plt.figure() 
fig.subplots_adjust (hspace=.3) 
ax = fig.add _ subplot(211) 


ax.xaxis.set minor_locator(alldays) 

ax.xaxis.set major_locator (months) 

ax.xaxis.set_ major_formatter (month formatter) 
ax.tick params (axis='both', which='major', labelsize='x-large') 


amps = np.abs (fftpack.fftshift(fftpack.rfft(y))) 
amps[amps < amps.max()] = 0 


def residuals(p, y, Xx): 
A,k,theta,b = P 
err = y-A * np.sin(2* np.pi* k * x + theta) + b 


return err 


filtered = -fftpack.irfft(fftpack.ifftshift (amps)) 


N = len(qqaq) 
f = np.linspace(-N/2, N/2, N) 
p0 = [filtered.max(), flamps.argmax()]/(2*N), 0, 0] 


print "PO"™, BO 


plsqgq = optimize.leastsq(residuals, pO0, args=(filtered, dates)) 

p = plsq[0] 

print. TE “bp 

plt.plot(dates, y, 'o', label="detrended") 

plt.plot (dates, filtered, label="filtered") 

plt.plot(dates, p[0] * np.sin(2 * np.pi * dates * p[1] + p[2]) +p[3], '^', label="fit") 
fig.autofmt_ xdate() 

plt.legend (prop={'size':'x-large'}) 


ax2 = fig.add subplot(212) 
ax2.tick params (axis='both', which='major', labelsize='x-large') 


plt.plot(f, amps, label="transformed") 


plt.legend (prop={'size':'x-large'}) 
plt.show!() 


13 ”数值 积分 
Scipy 中 有 数值 积分 的 包 scipy. integrate， 在 NumPy 中 没有 相同 功能 的 包 。auaad 函 数 可 
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以 求 单 变 量 函 数 在 两 点 之 间 的 积分 , 这 些 点 之 间 的 距离 可 以 是 无 穷 小 或 无 穷 大 。 该 函数 使 用 最 简 
单 的 数值 积分 方法 即 梯形 法 则 (trapezoid rule ) 进行 计算 。 


10.14 动手 实践 : 计算 高 斯 积分 

高 斯 积分 ( Gaussian integral ) 出 现在 误差 函数 ( 数学 中 记 为 erf ) 的 定义 中 ， 但 高 斯 积分 本 
身 的 积分 区 间 是 无 穷 的 ， 它 的 值 等 于 pi 的 平方 根 。 我 们 将 使 用 auadq 函 数 计算 它 。 

使 用 quad 函数 计算 高 斯 积分 。 


print "Gaussian integral", np.sqrt (np.pi), 
integrate.quad(lambda x: np.exp(-x**2), -np.inf, np.inf) 


计算 结果 和 对 应 的 误差 如 下 所 示 : 


Gaussian integral 1.77245385091 (1.7724538509055159, 1.4202636780944923e- 08) 









































刚才 做 了 些 什么 
我 们 使 用 guaq 函 数 计 算 了 高 斯 积分 。 














10.15 ”插值 


插值 ( interpolation ) 即 在 数据 集 已 知 数据 点 之 间 “ 填 补 空白 "”。scipy.interpolate 国 数 
可 以 根据 实验 数据 进行 插值 。interp1d 类 可 以 创建 线性 插值 (linear interpolation ) 或 三 次 插值 
( cubic interpolation ) 的 函数 。 上 默认 将 创建 线性 插值 函数 ， 三 次 插值 函数 可 以 通过 设置 kind 参 数 
来 创建 。interp2g 类 的 工作 方式 相同 ， 只 不 过 用 于 二 维 插值 。 
































10.16 ”动手 实践 : 一 维 插值 


我 们 将 使 用 sinc 图 数 创建 数据 点 并 添加 一 些 随机 噪音 。 随 后 ， 我 们 将 进行 线性 插值 和 三 次 
插值 ， 并 绘制 结果 。 请 完成 如 下 步骤。 


(1) 创建 数据 点 并 添加 噪音 : 








x = np.linspace(-18, 18, 36) 
noise = 0.1 * np.random.random(len (x)) 
signal = np.sinc(x) + noise 


(2) 创建 一 个 线性 择 值 函 数 ， 并 应 用 于 有 5 倍数 据点 个 数 的 输入 数组 : 





interpreted = interpolate.interpld(x, signal) 
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x2 = np.linspace(-18, 18, 180) 
y = interpreted (x2) 


(3) 执行 与 前 一 步 相 同 的 操作 ， 不 过 这 里 使 用 三 次 插值 。 


cubic = interpolate.interpld(x, signal, kind="cubic") 
V2 = CUBEG{X2) 


(4) 使 用 Matplotlitb 绘 制 结 





DT 


plt.plot (x, signal, 'o', label="data") 


plt.plot (x2, y, '-', label="linear") 
Plt..PLIOt (2 vy2y =" Twa2, label="ceubie™.) 
plt.legend() 

plt.show!() 


绘制 的 数据 点 、 线 性 插值 和 三 次 插值 结果 如 下 图 所 示 。 
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e e data 
-一 linear 
0.8 一 cubic 
0.6 
0.4 
0.2 
0.0 
“90 -15 -10 -5 0 3 10 15 20 











刚才 做 了 些 什么 


我 们 用 sinc 函 数 创 建 了 一 个 数据 集 并 加 入 了 噪音 ,然后 使 用 scipy .interpolate 模 块 中 的 





interp1ld 类 进行 了 线性 插值 和 三 次 插值 。 示 例 代码 见 sincinterp.py 文 件 。 
import numpy as np 
from seipy import interpolate 
import matplotlib.pyplot as plt 
x = np.linspaee(-18, 18, 36) 
noise = 0.1 * np.random.random(len (x)) 


signal = np.sinc(x) + noise 


interpreted = interpolate.interpld(x, signal) 
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x2 = np.linspace(-18, 18, 180) 
y = interpreted (x2) 


cubic = interpolate.interpld(x, signal, kind="cubic") 
v2 = Cubic (x2) 


plt.plot (x, signal, 'o', label="data") 
plt.plot (x2, y, '-', label="linear") 
plt.plot (x2, y2, '-', lw=2, label="cubic" ) 


plt.legend() 
plt.show!() 


10.17 图像 处 理 
我 们 可 以 使 用 scipy.ndqimage 包 进行 图 像 处 理 。 该 模块 包含 各 种 图 像 滤 波 器 和 工具 函数 。 


10.18 动手 实践 : 处 理 Lena 图 像 


在 scipy .misc 模 块 中 , 有 一 个 函数 可 以 载 人 Lena 图 像 。 这 幅 Lena Soderberg 的 图 像 是 被 用 做 
图 像 处 理 的 经 典 示例 图 像 。 我 们 将 在 该 图 像 上 应 用 一 些 滤 波 器 ， 并 进行 旋转 操作 。 请 完成 如 下 
步骤 。 


(1) 载 人 Lena 图 像 ， 并 使 用 灰 度 颜色 表 将 其 在 子 图 中 显示 出 来 。 


image = misc.lena() .astype (np.float32) 








Dlt,.subplot (221) 
plt.title("Original Image") 
img = plt.imshow(image, cmap=plt.cm.gray) 


注意 ,我 们 处 理 的 是 一 个 float32 类 型 的 数组 。 


(2) 中 值 滤波 带 扫 描 信 号 的 每 一 个 数据 点 ， 并 替换 为 相 邻 数据 点 的 中 值 。 对 图 像 应 用 中 值 渡 
波 铝 并 显示 在 第 二 个 子 图 中 。 


blt.subplot (222) 

plt.title("Median Filter") 

filtered = ndimage.median filter(image, size=(42,42)) 
plt.imshow(filtered, cmap=plt.cm.gray) 


(3) 旋转 图 像 并 显示 在 第 三 个 子 图 中 。 


Dlt,.subplot (223) 

plt.title("Rotated") 

rotated = ndimage.rotate (image, 90) 
plt.imshow(rotated, cmap=plt.cm.gray) 
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(4) Prewitt 滤 波 器 是 基于 图 像 强度 的 梯度 计算 。 对 图 像 应 用 Prewitt 滤 波 器 并 显示 在 第 四 个 子 
图 中 。 


plt.subplot (224) 

plt.title("Prewitt Filter") 

filtered = ndimage.prewitt (image) 
plt.imshow(filtered, cmap=plt.cm.gray) 
plt.show!() 


结果 如 下 图 所 示 。 





Original Image 


Median Filter __ 





Prewitt Filter 














刚才 做 了 些 什么 
我 们 使 用 scipy .ndimage 模 块 对 Lena 图 像 进 行 了 一 些 处 理 操作 ,示例 代 码 见 images.py 文 件 。 


from scipy import misc 

import numpy as np 

import matplotlib.pyplot as plt 
from scipy import ndimage 


image = misc.lena() .astype (np.float32) 


plt.subplot (221) 

plt.title("Original Image") 

img = plt.imshow(image, cmap=plt.cm.gray) 
plt.axis("off") 





plt.subplot (222) 
plt.title("Median Filter") 
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filtered = ndimage.median filter(image, size=(42,42)) 


plt.imshow(filtered, cmap=plt.cm.gray) 
忆 1 世 (OEE 

plt.subplot (223) 

plt.title("Rotated") 

rotated = ndimage.rotate(image, 90) 
plt.imshow(rotated, cmap=plt.cm.gray) 
plt.axis("off") 

plt.subplot (224) 

plt.title("Prewitt Filter") 

filtered = ndimage.prewitt (image) 
plt.imshow(filtered, cmap=plt.cm.gray) 
plt.axis("off") 

plt.show!() 





10.19 ”音频 处 理 


既然 我 们 已 经 完成 了 一 些 图 像 处 理 的 操作 ， 你 可 能 不 会 惊讶 我 们 也 可 以 对 WAV 文 件 进行 处 
理 。 我 们 将 下 载 一 个 WAV 文 件 并 将 其 重复 播放 几 次 。 下 载 音频 的 部 分 将 被 省 略 ， 只 保留 常规 的 
Python 代码 。 








10.20 动手 实践 : 重复 音频 片段 


我 们 将 下 载 一 个 WAV 文 件 ， 来 自 电 影 《 王 牌 大 贱 谍 》( Austin Powers ) 中 的 一 声 呼喊 : 
“Smashing, baby!” 使 用 scipy .io.wavfile 模 块 中 的 read 孙 数 可 以 将 该 文件 转换 为 一 个 NumPy 
数组 。 在 本 节 教 程 的 最 后 ,我 们 将 使 用 同一 模块 中 的 write 函数 写 人 一 个 新 的 WAV 文 件 。 我 们 将 
使 用 tile 函 数 来 重复 播放 音频 片段 。 请 完成 如 下 步骤 。 

(1) 使 用 read 函 数 读 入 文件 : 

sample rate, data = wavfile.read (WAV_FILE) 


该 函数 有 两 个 返回 值 一 一 采样 率 和 音频 数据 。 在 本 节 教 程 中 ,我们 只 需要 用 到 音频 数据 。 
(2) 应 用 tile 国 数 : 














repeated = np.tile(data, int(sys.argv[1])) 
(3) 使 用 write 函数 写 人 一 个 新 文件 : 
wavfile.write("repeated yababy.wav", sample_rate, repeated) 


原始 音频 数据 和 重复 四 遍 的 音频 片段 如 下 图 所 示 。 
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Original 
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刚才 做 了 些 什么 


我 们 读 入 了 一 个 音频 片段 ， 将 甚 重复 四 遍 并 将 新 数组 写 人 了 一 个 新 的 WAV 文 件 。 示 例 代码 
见 repeat audio.py 文 件 。 


from scipy.io import wavfile 
import matplotlib.pyplot as plt 
import urllib2 

import numpy as np 

import sys 


response = urllib2.urlopen('http://www.thesoundarchive.com/austinpowers/ 
smashingbaby .wav') 

print response.info!() 

WAV_FILE = 'smashingbaby .wayv' 

filehandle = open (WAV_FILE, 'w') 

filehandle.write(response.read()) 

filehandle.close() 

sample_rate, data = wavfile.read (WAV_FILE) 

print "Data type", data.dtype, "Shape", data.shape 





plt. suBplot(2, 1, 1) 
plt.title("Original" ) 
plt.plot (data) 





plt.subplot(2, 1, 2) 


# 重复 音频 片段 
repeated = np.tile(data, int(sys.argv[1])) 


# 绘制 音频 数据 
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plt.title("Repeated") 
plt.plot (repeated) 
wavfile.write("repeated yababy.wav", sample_rate, repeated) 


plt.show () 


10.21 本 章 小 结 

在 本 章 中 ， 我们 只 是 触及 了 SciPy 和 SciKits 的 皮毛 ， 学 习 了 一 点 关于 文件 输入 /输出 、 统 计 、 
信号 处 理 、 数 学 优化 、 插 值 以 及 音频 和 图 像 处 理 的 知识 。 

在 下 一 章 中 ， 我 们 将 使 用 Pygame 制 作 一 些 简单 但 有 趣 的 游戏 。Pygame 是 一 个 开源 的 Python 
游戏 库 。 在 这 个 过 程 中 ， 我们 将 学 习 NumPy 和 Pygame 的 集成 、SciKits 机 器 学 习 模 块 以 及 其 他 
内 容 。 
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本 章 写 给 需要 使 用 NumPy 和 Pygame 快 速 并 且 简 易 地 进行 游戏 制作 的 开 
发 者 。 基 本 的 游戏 开发 经 验 对 于 阅读 本 章 内 容 有 帮助 ， 但 并 不 是 必需 的 。 


章 涵盖 以 下 内 容 ， 


口 Pygame 基 础 ; 
口 Matplotlib 集 成 ; 
口 屏幕 像素 矩阵 ; 
口 人 工 智能 ; 

口 动画 ; 

口 OpenGL。 





11.1 Pygame 














Pygame 最 初 是 由 Pete Shinners 编 写 的 一 套 Python 架构 。 顾 名 思 义 ，Pygame 可 以 用 于 制作 电子 
游戏 。 自 2004 年 起 ，Pygame 成 为 GPL ( General Public License， 通 用 公共 许可 证 ) 下 的 开源 免费 
软件 , 这 意味 着 你 可 以 使 用 它 制作 任何 类 型 的 游戏 。Pygame 基 于 SDL ( Simple DirectMedia Layer， 
简易 直 控 媒体 层 )。SDL 是 一 套 C 语 言 架构 ， 可 用 于 在 各 种 操作 系统 中 (包括 Linux 、Mac OS X 和 
Windows ) 访问 图 形 、 声 音 、 键 盘 以 及 其 他 输入 设备 。 

















11.2 ”动手 实践 : 安装 Pygame 


在 本 节 教 程 中 ， 我 们 将 安装 Pygame。Pygame 基 本 上 可 以 与 所 有 版 本 的 Python 兼容 。 不 过 在 
编写 本 书 的 时 候 ， 和 Python 3 仍 有 一 些 兼容 问题 ， 但 这 些 问 题 很 可 能 不 久 就 会 被 修复 。 请 完成 如 
下 步骤 安装 Pygame。 
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(1) 根据 你 所 使 用 的 操作 系统 ， 选 择 一 种 方式 安装 Pygame。 


口 Debian 和 Ubuntu Pygame 可 以 在 Debian 软 件 库 中 找到 : 

http://packages.qa.debian.org/p/ pygame.html。 

口 Windows 根据 所 使 用 的 Python 版 本 ， 我 们 可 以 从 Pygame 的 网 站 上 ( http://www.pygame. 
org/download.shtml ) 下 载 合 适 的 二 进 制 安装 包 。 

口 Mac Pygame 在 Mac OS X 10.3 及 以 上 版 本 的 二 进 制 安装 包 也 可 以 在 这 里 下 载 : 
http:/www.pygame.org/download.shtml。 





























(2) Pygame 支 持 distutils 系 统 进行 编译 和 安装 。 按照 默认 选项 安装 Pygame， 只 需要 简单 执 
行 如 下 命令 : 














python setup.py 


如 果 你 需要 关于 安装 选项 的 更 多 信息 ， 请 输入 : 





python setup.py help 

(3) 编译 代码 需要 操作 系统 上 的 编译 器 支持 。 配 置 编译 器 环境 超出 了 本 书 的 范畴 。 更 多 关于 
在 Windows 系 统 上 编译 Pygame 的 信息 请 访问 http:/pygame.org/wikiCompileWindows。 更 多 关于 在 
Mac OS X 系 统 上 编译 Pygame 的 信息 请 访问 http:/pygame.org/wiki/MacCompile。 






































11.3 Hello World 


我 们 将 制作 一 个 简单 的 游戏 ， 并 在 本 童 后 续 内 容 中 加 以 改进 。 按 照 程序 设计 类 书籍 的 传统 ， 
我 们 将 从 一 个 Hello World 示 例 程序 开始 。 


11.4 动手 实践 : 制作 简单 游戏 


值得 注意 的 是 ， 所 有 的 动作 都 会 在 所 谓 的 游戏 主 循环 中 发 生 ， 以 及 使 用 font 模 块 来 呈现 文 
本 。 在 这 个 程序 中 ， 我 们 将 利用 Pygame 的 surface 对 象 进行 绘图 ， 并 处 理 一 个 退出 事件 。 请 完 
成 如 下 步 又。 


(首先 , 导入 所 需要 的 Pygame 模 块 。 如 果 Pygame 已 经 正确 安装 , 将 不 会 有 任何 报错 ; 否则 ， 
请 返回 安装 教程 。 


























import pygame, SYS 
from pygame.locals import * 


(2) 我 们 将 初始 化 Pygame， 创 建 一 块 400 x 300 像 素 大 小 的 显示 区 域 ， 并 将 窗口 标题 设置 为 
Hello World!, 
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pygame.init() 
screen = pygame.display.set mode((400, 300)) 


pygame .display.set_ caption('Hello World!') 


(3) 游戏 通常 会 有 一 个 主 循环 一 直 运 行 ， 直 到 退出 事件 的 发 生 。 在 本 例 中 ， 我 们 仅仅 在 坐标 
(100，100) 处 设置 一 个 Hello World 文 本 标签 ， 文 本 的 字体 大 小 为 19， 颜 色 为 红色 。 





山中 

















while True: 
sysFont = pygame.font.SysFont ("None", 19) 
rendered = sysFont.render ('Hello World', 0, (255, 100, 100)) 
screen.blit(rendered, (100, 100)) 


for event in pygame .event .get() : 
if event .type == QUIT: 
pygame .quit () 
sys.exit() 


pygame .display.update!() 


得 到 的 结果 如 下 图 所 示 。 


Hello Worid! 





示例 程序 Hello World 的 完整 代码 : 


import pygame, sys 
from pygame.locals import * 


pygame.init() 
screen = pygame.display.set mode((400, 300)) 


pygame .display.set_ caption('Hello World!') 


while True: 
sysFont = pygame.font.SysFont ("None", 19) 
rendered = sysFont.render ('Hello World', 0, (255, 100, 100)) 
screen.blit(rendered, (100, 100)) 





for event in pygame.event .get() : 
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if event.type == QUIT: 
pygame .quit() 
SYS .exit() 


pygame .display.update() 


刚才 做 了 些 什 么 





在 本 节 教 程 中 ,虽然 看 起 来 内 容 不 多 , 但 其 实 我 们 已 经 学 习 了 很 多 。 我 们 将 出 现 过 的 函数 总 


结 在 下 面 的 表格 中 。 


函数 


描 述 





pygame.init() 


pygame.display.set mode((400, 300)) 
























































pygame .display.set_caption('Hello World!') 该 


pygame.font.SysFont ("None", 19) 


100)) 


screen.blit (rendered, (100, 100)) 


pygame .event .get () 


pygame.quit () 


pygame .display.update() 


11.5 ”动画 

















该 








函数 可 将 窗口 标题 设置 为 指定 的 字符 串 

















为 None ) 和 字体 大 小 创建 字体 对 象 


sysFont.render('Hello World', 0, (255, 100, 该 











， 即 以 RGB 值 表示 的 颜色 
函数 在 surface 对 象 上 进行 绘制 





























一 些 特 殊 事 件 ， 如 用 户 退 出 游戏 


该 





函数 清理 Pygame 使 用 的 资源 。 在 退出 游戏 前 调 

















该 














国 数 刷新 屏幕 上 显示 的 内 容 





函数 用 于 初始 化 ， 需 要 在 调用 其 他 Pygame 函 数 前 被 调用 
函数 创建 所 谓 的 surface 对 象 用 于 绘图 。 我 们 为 该 函数 提 
一 个 元 组 来 表示 对 象 的 大 小 














函数 根据 英文 逗号 隔 开 的 系统 字体 列表 字符 串 ( 在 本 例 中 


函数 在 surface 对 象 上 呈现 文本 。 最 后 一 个 参数 是 一 个 元 


该 函数 用 于 获取 Event 对 象 列 表 。Event 对 象 表示 系统 中 的 














] 此 函数 





大 部 分 游戏 ， 即 使 是 最 “静态 ”的 那些 ,也 有 一 定 程度 的 动画 部 分 。 从 一 个 程序 员 的 角度 来 





看 ， 动 画 只 不 过 是 不 同 的 时 间 在 不 同 





也 点 显示 对 象 ， 从 而 模拟 对 象 的 移动 。 





Pygame 提 供 clock 对 象 ， 用 于 控制 每 秒 钟 绘图 的 帧 数 。 这 可 以 保证 动画 与 CPU 的 快慢 无 关 。 


11.6 ”动手 实践 : 使 用 NumPy 和 Pygame 制作 动画 对 象 
我 们 将 载 和 一 个 图 像 并 使 用 NumPy 定 义 一 条 沿 屏 幕 的 顺 时 针 路 径 。 请 完成 如 下 步骤 。 
(1) 创建 一 个 Pygame 的 clock 对象 ， 如 下 所 示 : 





Clock = pygame.time.Clock() 
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着 


(2) 和 本 书 配套 的 源 代 码 文件 一 起 ， 有 一 张 头 部 的 图 片 。 我 们 将 载 人 这 张 图 片 ， 并 使 之 在 
幕 上 移动 。 


img = pygame.image.load('head.jpg') 


(3) 我 们 将 定义 一 些 数组 来 储存 动画 中 图 片 的 位 置 坐标 。 既 然 对 象 可 以 被 移动 ， 那 么 应 该 有 








四 个 方向 一 一 上 、 下 、 左 、 右 。 每 一 个 方向 上 都 有 40 个 等 距 的 步 长 。 我 们 将 各 方向 上 的 值 全 部 初 
始 化 为 0。 

steps = np.linspace(20, 360, .astype (int) 

二 二 ) 


down = np.zeros((2, lenl(steps 
left = np.zeros((2, lenl(steps 
up = np.zeros((2, len(steps)) 


(4) 设置 图 片 的 位 置 坐标 是 一 件 很 烦琐 的 事情 。 不 过 ， 有 一 个 小 技巧 可 以 用 上 一 一 [::-1] 可 
以 获得 倒序 的 数组 元 素 。 


40) 

np.zeros((2, len(steps)) 
) ) ) 
) ) ) 
) 


right[0] = steps 
right[1] = 20 

down[0] = 360 

down[1] = steps 
left[0] = steps[::-1] 
left[1] = 360 

up[0] = 20 

up[1] = steps[::-1] 





(5) 四 个 方向 的 路 径 可 以 连接 在 一 起 , 但 需要 先 用 fT 操作 符 对 数组 进行 转 置 操作 , 使 得 它们 以 
正确 的 方式 对 齐 。 


pos = np.concatenate( (right.T, down.T, left.T, up.T)) 
(6) 在 主 循环 中 ， 我 们 设置 时 钟 周期 为 每 秒 30 帧 : 
CSLocl tick(30) 


以 下 是 动画 的 截图 。 











(=A) Animating Objects 
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你 可 以 访问 https:/www.youtube.com/watch?v=m2TagGiqlfs 观 看 本 动画 的 视频 。 
本 例 中 的 代码 用 到 了 几乎 我 们 学 习 到 的 所 有 内 容 ， 不 过 应 该 很 容易 理解 : 


import pygame, sys 
from pygame.locals import * 
import numpy as np 
pygame.init() 
Clock = pygame.time.Clock() 
screen = pygame.display.set mode((400, 400)) 


pygame.display.set_ caption('Animating Objects') 
img = pygame.image.load!('head.jpg') 


steps = np.linspace(20, 360, 4 
right = np.zeros((2, lenl(steps 
down = np.zeros((2, lenl(steps) 
) 
) 


0) .astype (int) 

) ) ) 

) ) 
left = np.zeros((2, lenl(steps))) 
up = np.zeros((2, lenl(steps)) 


right[0] = steps 
right[l1] = 20 


down[0] = 360 
down[1] = steps 


left[0] = steps[::-1] 
left[1] = 360 


up[0] = 20 

up[1] = steps[::-1] 

pos = np.concatenate( (right.T, down.T, left.T, up.T)) 
二 二 


while True: 
# 清 屏 
SCreen. £1iLl((255,. 255 255)) 


if i >= len(pos): 
0 
screen.blit(img, pos[i]) 


i += 1 


for event in pygame.event .get(): 
if event.type == QUIT: 
pygame .quit () 
SYS .exit() 


pygame .display.update() 
clock.tick(30) 


刚才 做 了 些 什么 
在 本 节 教 程 中 我 们 学 习 了 一 点 关于 动画 的 内 容 , 其 中 最 重要 的 就 是 时 钟 的 概念 。 我 们 将 使 用 
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到 的 新 函数 总 结 在 下 面 的 表格 中 。 























函 数 描 述 
pygame .time.Clock () 该 函数 创建 一 个 游戏 中 的 时 钟 对 象 
clock.tick(30) 该 函数 设置 时 钟 周期 。 这 里 的 30 即 每 秒 钟 的 帧 数 








11.7 Matplotlib 


我 们 在 第 9 章 中 学 习 过 Matplotlib, 这 是 一 个 可 以 便捷 绘图 的 开源 工具 库 。 我 们 可 以 在 Pygame 
中 集成 Matplotlib ， 绘 制 各 种 各 样 的 图 像 。 





11.8 ”动手 实践 : 在 Pygame 中 使 用 Matplotlib 
在 本 节 教 程 中 ， 我 们 将 使 用 前 一 节 教 程 中 的 位 置 坐标 并 为 其 绘制 图 像 。 请 完成 如 下 步 又。 


(1) 使 用 非 交互 式 的 后 台 : 为 了 在 Pygame 中 集成 Matplotlib, 我 们 需要 使 用 一 个 非 交 互 式 的 后 
台 ， 否则 Matplotlib 会 默认 显示 一 个 GUJ 窗 口 。 我 们 将 引入 Matplotlib 主 模块 并 调用 use 函 数 。 该 函 
数 必须 在 引入 Matplotlib 主 模块 后 并 引入 其 他 Matplotlib 模 块 前 立即 调用 。 

















import matplotlib as mpl 

mpl.use("Agg") 

(2) 非 交 互 式 绘图 可 以 在 Matplotlib 画 布 ( canvas ) 上 完成 。 创 建 画布 需要 引入 模块 、 创 建 图 
像 和 子 图 。 我 们 将 指定 图 像 大 小 为 3 x 3 英寸 。 更 多 细节 请 参阅 本 节 末 尾 的 代码 。 


import matplotlib.pyplot as plt 
import matplotlib.backends.backend agg as agg 


fig = plt.figure(figsize=[3, 3]) 
ax = fig.add subplot(111) 
canvas = agg.FigureCanvasAgg (fig) 


(3) 在 非 交 互 模式 下 绘图 比 在 默认 模式 下 稍 复杂 一 点 。 由 于 我 们 要 反复 多 次 绘图 ， 因 此 有 必 
要 将 绘图 代码 组 织 成 一 个 函数 。 图 像 最 终 应 绘制 在 画布 上 ， 这 使 得 我 们 的 步 又 变 得 复杂 了 一 些 。 
在 本 例 的 最 后 ， 你 可 以 找到 这 些 函 数 更 为 详细 的 说 明 。 
def Plot (daata) : 
ax.plot (data) 


canvas .draw() 
renderer = canvas.get_renderer () 














raw_data = renderer.tostring_ rgb() 
size = canvas.get width height() 


return pygame.image.fromstring (raw_ data, size, "RGB") 
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动画 的 截图 如 下 所 示 。 你 也 可 以 访问 YouTube 观 看 本 例 的 视频 ， 地 址 为 https:/www.youtube. 
com/watch?v=t6qTeXxtnl4 。 


Animating Objects 


06 50Q00D50pB00B50ED0E604000 





(4) 改动 后 的 代码 如 下 所 示 : 


import pygame, sys 

from pygame.locals import * 
import numpy as np 

import matplotlib as mpl 


mpl.use("Agg") 
import matplotlib.pyplot as plt 
import matplotlib.backends.backend agg as agg 


fig = plt.figure(figsize=[3, 3]) 
ax = fig.add subplot(111) 
canvas = agg.FigureCanvasAgg (fig) 


def plot (data): 
ax.plot (data) 
canvas .draw() 


renderer = canvas.get_renderer() 


raw_data = renderer.tostring_ rgb() 
size = canvas.get _ width height() 


return pygame.image.fromstring (raw_ data, size, "RGB") 
pygame.init() 


clock = pygame.time.Clock() 
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screen = pygame.display.set mode((400, 400)) 


pygame .display.set_ caption('Animating Objects') 
img = pygame.image.load('head.jpg') 


steps = np.linspace(20, 360, 


40) .astype (int) 
right = np.zeros((2, lenl(steps) 

) ) 

) ) 

) 


) 
down = np.zeros((2, lenl(steps 
left = np.zeros((2, lenl(steps 
up = np.zeros((2, len(steps)) 


) 
) 
) 
) 


right[0] = steps 
right[1] = 20 

down[0] = 360 

down[1] = steps 

left[0] = steps[::-1] 
下 全 于 心 [下 | = 360 

up[0] = 20 

这 闻 半 二 ] 二 steps[::-1] 





pos = np.concatenate( (right.T, down.T, left.T, up.T)) 
0 

history = np.array([]) 

Surf = pLot(listory) 


while True: 
# 清 屏 
screen.fill((255, 255, 255)) 


If i >= len(pos): 
i=0 
surf = plot(history) 


screen.blit(img, pos[i]) 
history = np.append(history, pos[i]) 
screen.blit(surf, (100, 100)) 


i += 1 
for event in pygame .event .get() : 
if event .type == QUIT: 
pygame .Guit () 
SYS .exit() 


pygame .display.update() 
clock.tick(30) 


刚才 做 了 些 什 么 
下 表 给 出 了 绘图 相关 函数 的 说 明 。 
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函 数 描 述 
mpl.use("Rgg") 该 函数 指定 使 用 非 交 互 式 后 端 
plt.figure(figsize=[3, 3]) 该 函数 创建 一 个 大 小 为 3 x 3 平方 英寸 的 图 像 





函数 在 非 交 互 模式 下 创建 一 个 画布 





agg.FigureCcanvasRAgg (fig) 




















canvas .draw () 该 函数 在 画布 上 进行 绘制 
Canvas.get_renderer () 该 函数 获取 画布 的 浑 染 器 


11.9 屏幕 像素 


Pygame 的 surfarray 模 块 可 以 处 理 PygameSurface 对 象 和 NumPy 数 组 之 间 的 转换 。 你 或 许 
还 记得 ，NumPy 可 以 快速 、 高 效 地 处 理 大 规模 数组 。 


11.10 ”动手 实践 : 访问 屏幕 像素 
在 本 节 教 程 中 ， 我 们 将 平 铺 一 张 小 图 片 以 填充 游戏 界面 。 请 完成 如 下 步 又 。 


(1) array2d 函 数 将 像素 存 人 一 个 二 维 数 组 。 还 有 相似 的 函数 ， 将 像素 存 入 三 维 数组 。 我 们 
将 avatar 头 像 图 片 的 像素 存 人 数组 : 


pixels = pygame.surfarray.array2d (img) 


(2) 我 们 使 用 shape 属 性 获取 像素 数组 pixels 的 形状 ， 并 据 此 创建 游戏 界面 。 游 戏 界面 的 长 
和 宽 都 将 是 像素 数组 的 7 倍 大 小 。 














X = pixels.shape[0] * 7 
Y = pixels.shape[1] * 7 
Screen = pygame.display.set mode( (X, Y)) 


(3) 使 用 tile 函 数 可 以 轻松 平 铺 图 片 。 由 于 颜色 是 定义 为 整数 的 ， 像 素数 据 需 要 被 转换 成 
整数 。 


new_pixels = np.tile(pixels, (7, 7)).astype (int) 


(4) surfarray 模 块 中 有 一 个 专用 孙 数 blit_array， 可 以 将 数组 中 的 像素 呈现 在 屏幕 上 。 








pygame.surfarray.blit array (screen, new_ pixels) 


效果 如 下 图 所 示 。 
平 铺 图 片 的 完整 代码 如 下 : 


import pygame, SYS 
from pygame.locals import * 
import numpy as np 
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DPygame .init() 

img = pygame.image.load!('head.jpg') 

pixels = pygame.surfarray.array2d (img) 

XxX = pixels.shape[0] * 7 

Y = pixels.shape[1] * 7 

Screen = pygame.display.set mode( (XxX, Y)) 
pygame.display.set_ caption('Surfarray Demo') 
new_pixels = np.tile(pixels, (7, 7)).astype(int) 


while True: 
Screen. £ill((255, 255, 255)) 
pygame.surfarray.blit array (screen, new_ pixels) 


for event in pygame.event.get(): 
if event.type == QUIT: 
pygame .Guit () 
SYS .exit() 


pygame.dqisplavyv.update() 


@ANM Surfarray Demo 





刚才 做 了 些 什 么 
下 面 的 表格 给 出 了 新 函数 及 其 属性 的 简单 说 明 。 








函 数 描 述 
pygame.surfarray .array2d (img) 该 函数 将 像素 数据 存 人 一 个 二 维 数组 
pygame.surfarray.blit array (screen, new pixels) 该 函数 将 数组 中 的 像素 呈现 在 屏幕 上 
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11.11 “人工 智能 


在 游戏 中 , 我 们 通常 需要 模拟 一 些 智能 行为 。scikit-learn 项 目 旨 在 提供 机 带 学 习 的 API， 
我 最 喜欢 的 是 其 出 色 的 文档 。 我 们 可 以 使 用 操作 系统 的 包 管 理 顺 来 安装 scikit-learn， 这 取决 
于 你 所 使 用 的 操作 系统 是 否 支持 ， 但 应 该 是 最 为 简便 的 安装 方式 。Windows 用 户 可 以 直接 从 项 目 
网 站 上 下 载 安 装 包 。 












































在 Debian 和 Ubuntu 上 ， 该 项 目 名 为 python-sklearn。 在 MacPorts 命 名 为 bv26-scikits- 
learn 和 py2 7-scikits-learno。o 我 们 也 可 以 从 源 代码 安装 或 使 用 easy_instal 1 工具 ， 还 有 第 
三 方 发 行 版 如 Python(x, y)、Enthought 和 NetBSD。 


我 们 可 以 在 命令 行 中 键入 如 下 命令 安装 scikit-learn: 











pip install -U scikit-learn 
也 可 以 使 用 如 下 命令 : 
easy_install -U scikit-learn 


这 个 命令 可 能 会 由 于 权限 设置 无 法 工作 ， 因 此 你 可 能 需要 在 命令 前 面 加 上 suqo 或 以 管理 
身份 登陆 系统 。 


jr 
汇 


/ 





11.12 ”动手 实践 : 数据 点 聚 类 


我 们 将 随机 生成 一 些 数据 点 并 对 它们 进行 聚 类 ， 也 就 是 将 相近 的 点 放 到 同一 个 聚 类 中 。 这 只 
是 scikit-1learn 提 供 的 众多 技术 之 一 。 聚 类 是 一 种 机 需 学 习 算 法 ， 即 依据 相似 度 对 数据 点 进行 分 
组 。 随 后 , 我 们 将 计算 一 个 关联 矩阵 。 关 联 和 矩阵 即 包含 关联 值 的 矩阵 , 如 点 与 点 之 间 的 距离 。 最 后 ， 
我 们 将 使 用 scikit-learn 中 的 AffinityPropagation 类 对 数据 点 进行 聚 类 。 请 完成 如 下 步骤 。 
(1) 我 们 将 在 400 x 400 像 素 的 方块 内 随机 生成 30 个 坐标 点 : 


positions = np.random.randint (0, 400, size=(30, 2)) 


(2) 我 们 将 使 用 欧 氏 距离 ( Euclidean distance ) 来 初始 化 关联 矩阵 。 





























positions_ norms = np.sum(positions ** 2, axis=1) 
S = - positions norms[:, np.newaxis] - positions norms[np.newaxis, :] + 2 * 
np.dot (positions, positions.T) 


(3) 将 前 一 步 的 结果 提供 给 AffinityPropagation 类 。 该 类 将 为 每 一 个 数据 点 标记 合适 的 
聚 类 编号 。 


aff pro = sklearn.cluster.AffinityPropagation().fit(s) 
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labels = aff_ pro.labels_ 


(4) 我 们 将 为 每 一 个 肾 类 绘制 多 边 形 。 该 函数 需要 的 参数 包括 surface 对 象 、 颜 色 (本 例 中 
使 用 红色 ) 和 数据 点 列表 。 


pygame .draw.polygon(screen, (255, 0, 0), polygon points[i]) 


绘制 结果 如 下 图 所 示 。 





pygame WiInGOW 





聚 类 程序 的 示例 代码 如 下 : 


import numpy as np 

import sklearn.cluster 
import pygame, sys 

from pygame.locals import * 


positions = np.random.randint (0, 400, size=(30, 2)) 
positions_ norms = np.sum(positions xx 2, axis=1) 
S = - positions norms[:, np.newaxis] - positions norms[np.newaxis, :] + 2 * 


np.dot (positions, positions.T) 


aff_pro = sklearn.cluster.AffinityPropagation().fit(s) 
labels = aff_ pro.labels_ 


polygon points = [] 


for i in xrange (max(labels) + 1): 
polygon points.append([]) 





# 对 数据 点 进行 聚 类 
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for i in xrange(len(labels)): 

polygon points[labels[i]].append (positions[i]) 
pygame.init() 
screen = pygame.display.set mode((400, 400)) 


while True: 
for i in xrange(len(polygon points)): 
pygame .draw.polygon(screen, (255, 0, 0), polygon points[i]) 
for event in pygame.event .get () : 
if event.type == QUIT: 
pygame .quit() 


SYS .exit() 


pygame .display.update() 


刚才 做 了 些 什 么 
下 面 的 表格 给 出 了 人 工 智能 示例 代码 中 最 重要 的 几 个 函数 的 功能 说 明 。 














函数 描述 
sklearn.cluster.AffinityPropagation() .fit(s) 该 函数 创建 AffinityPropagation 对 象 并 根据 关联 和 矩阵 
进行 聚 类 








Van 9 oe ol gn Soren (255，0,0)，Ppolygon 该 函数 根据 指定 的 Surface 对 象 、 颜 色 ( 在 本 例 中 为 红色 ) 
points[i We sr 
和 数据 点 列表 绘制 多 边 形 




















11.13 OpenGL 和 Pygame 


OpenGL 是 专业 的 用 于 二 维和 三 维 图 形 的 计算 机 图 形 应 用 程序 接口 | )， 由 函数 和 一 些 常 
数 构成 。 我 们 将 重点 关注 其 Python 的 实现 ， 即 PyOpenGL。 使 用 如 下 命令 安装 PyOpenGL : 











pip install PyOpenGL PyOpenGL accelerate 


你 可 能 需要 根 权 限 来 执行 这 条 命令 。 以 下 是 相应 的 easy_install 命 令 

















easy_install PyOpenGL PyOpenGL accelerate 


11.14 ”动手 实践 : 绘制 谢 尔 宾 斯 基地 秘 


为 了 演示 OpenGEL 的 功能 ， 我 们 将 使 用 OpenGL 绘 制 谢 尔 宾 斯 基地 毯 (Sierpinski gasket )， 亦 
称 作 谢 尔 宾 斯 基 三 角形 (Sierpinski triangle ) 或 谢 尔 宾 斯 基 和 筛子 ( Sierpinski sieve )。 这 是 一 种 三 
角形 形状 的 分 形 〈 fractal )， 由 数学 家 所 次 拟 夫 : 谢 尔 宾 斯 基 ( Waclaw Sierpinski ) 提出 。 这 个 三 
角形 是 经 过 原则 上 无 穷 的 递归 过 程 得 到 的 。 请 完成 如 下 步骤 绘制 谢 尔 宾 斯 基地 毯 。 
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(1) 首先 , 我 们 将 初始 化 一 些 OpenGL 相 关 的 基本 要 素 , 包括 设置 显示 模式 和 背景 颜色 等 。 在 
本 节 的 末尾 可 以 找到 相关 函数 的 详细 说 明 。 
def display_openGL (w, h): 


pygame .display.set_ mode( (w,h), 
pygame .OPENGL |pygame .DOUBLEBUF ) 








ylclearColor(0.0,; 0.0, 0.0, 1.0) 
glClear (GL_ COLOR_ BUFFER BIT|GL DEPTH_BUFFER_ BIT) 





glu0rtho2D(0, w, 0, h) 


(2) 依据 分 形 的 算法 ， 我 们 应 该 尽 可 能 多 地 准确 地 绘制 结 点 。 第 一 步 ， 我 们 将 绘制 颜色 设置 
为 红色 。 第 二 步 ， 我 们 定义 三 角形 的 顶点 。 随 后 ， 我 们 定义 随机 挑选 的 索引 ， 即 从 三 角形 的 3 个 
顶点 中 任意 选 出 其 中 一 个 。 从 三 角形 靠 中 间 的 位 置 随意 指定 一 点 一 一 这 个 点 在 哪里 并 不 重要 。 然 
后 ,我 们 在 前 一 次 的 点 和 随机 选 出 的 三 角形 顶点 之 间 的 中 点 处 进行 绘制 。 最 后 ,我 们 强制 刷新 组 
冲 以 保证 绘图 命令 全 部 得 以 执行 。 


dlCoLoOr3f (1..0, 0; 0) 

















vertices = np.array ([[0, 0], [DIM/2, DIM], [DIM，0]1]) 
NPOINTS = 9000 

indices = np.random.random integers(0, 2, NPOINTS) 
DOLnt :=: [L750 T1500] 


for i in xrange (NPOINTS): 
glBegin (GL_ POINTS) 
point = (point + vertices [indices[i]])/2.0 glVertex2fv(point) glEnd() 


glFlush() 


谢 尔 宾 斯 基 三 角形 如 下 图 所 示 。 





OpenGl Demo 
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绘制 谢 尔 宾 斯 基地 毯 的 完整 代码 如 下 : 


import pygame 
from pygame.locals import * 
import numpy as np 


from OpenGL.GL import * 
from OpenGL.GLU import * 


def display_openGL(w, h): 
pygame.display.set mode( (w,h), pygame .OPENGL |pygame .DOUBLEBUF ) 


gillearCoLlor(0.0; 0.0; 0.0; 1.0) 
glClear (GL_ COLOR_ BUFFER BIT|GL DEPTH_BUFFER_BIT) 





glu0rtho2D(0, w, 0, h) 


def main(): 
pygame.init() 
pygame.display.set_ caption('O0penGL Demo') 
DIM = 400 
display_openGL (DIM, DIM) 
glcolor3f(1.0, 0; 0) 
vertices = np.array ([[0, 0], [DIM/2, DIM], [DIM，0]]) 


NPOINTS = 9000 
indices = np.random.random integers(0, 2, NPOINTS) 
DOLnt [L750, 150.0] 


for i in xrange (NPOINTS): 
glBegin (GL_ POINTS) 


point = (point + vertices[indices[i]])/2.0 
glVertex2fv (point) 
glEnd() 

glFlush() 


pygame.display.flip() 


while True: 
for event in pygame.event .get() : 





if event.type == QUIT: 
return 
在 name == '_ _ main _' 
main() 
刚才 做 了 些 什么 


如 前 所 述 ， 下 面 的 表格 给 出 了 示例 代码 中 最 重要 的 一 些 函 数 的 功能 说 明 。 
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函 数 氛 还 

te DOUETSB0) 该 函数 将 显示 模式 设置 为 指定 的 宽度 、 高 度 和 openGL 对 
应 的 显示 类 型 

glClear (GL_COLOR_BUFFER_BIT|GL_DEPTH_BUFFER_BIT) ”该 函数 使 用 掩 码 清空 缓冲 区 。 在 本 例 中 , 我 们 清空 的 是 颜 
色 和 深度 缓冲 区 

ee 该 函数 根据 上 、 下 、 左 、 右 的 裁 切 平面 坐标 定义 一 个 2D 
的 正 交 投影 矩阵 

ee 该 函数 根据 三 个 浮 点 数 表 示 的 RGB 颜色 来 设置 当前 的 给 
图 颜色 。 在 本 例 中 为 红色 



































glBegin (GL_POINTS) 该 函数 限定 一 组 或 多 组 图 元 的 定点 定义 
glVertex2fv (point) 该 函数 根据 一 个 顶点 产生 一 个 点 
glEnd() 该 函数 结束 以 glBegin 开 始 的 代码 段 
glFlush() 该 函数 强制 刷新 缓冲 区 ， 执 行 绘图 命令 








11.15 ”模拟 游戏 


作为 最 后 一 个 示例 ， 我 们 将 根据 生命 游戏 ( Conway’s Game of Life ) 来 完成 一 个 模拟 生命 的 
游戏 。 原始 的 生命 游戏 是 基于 几 个 基本 规则 的 。 我 们 从 一 个 随机 初始 化 的 二 维 方形 网 格 开始 。 网 
格 中 每 一 个 细胞 的 状态 可 能 是 生 或 死 ， 由 其 相 邻 的 8 个 细胞 决定 。 在 这 个 规则 下 可 以 使 用 卷 积 进 
行 计算 ， 我 们 需要 SciPy 的 工具 包 完 成 卷 积 运算 。 








11.16 ”动手 实践 : 模拟 生命 
下 面 的 代码 实现 了 生命 游戏 ， 并 做 了 如 下 修改 : 


口 单 击 鼠 标 绘制 一 个 十 字 

上 按 下 r 键 将 网 格 重 置 为 随机 居 态 ， 

口 按 下 b 键 在 鼠标 位 置 创建 一 个 方块 ; 
口 按 下 g 键 创 建 一 个 形 如 滑翔 机 的 图 案 


本 例 的 代码 中 最 重要 的 数据 结构 就 是 一 个 二 维 数组 , 用 于 维护 游戏 界面 上 像素 的 颜色 值 。 该 
数组 被 随机 初始 化 , 然后 在 游戏 主 循环 中 每 一 轮 迭 代 重 新 计算 一 次 。 在 本 节 的 末尾 可 以 找到 相关 
函数 的 更 多 信息 。 

(1) 根据 游戏 规则 ， 我 们 将 使 用 卷 积 进行 计算 。 


def get pixar(arr, weights): 
states = ndimage.convolve(arr, weights, mode='wrap') 
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bools = (states == 13) | (states == 12 ) | (states == 
return bools.astype (int) 
(2) 我 们 可 以 使 用 在 第 2 章 中 学 到 的 索引 技巧 绘制 十 字 架 。 


def draw_cross (pixar): 


(posx, posy) = pygame.mouse.get_pos() 
pixar[posx, :] = 1 
pixar[:, posy] = 1 


(3) 随机 初始 化 网 格 : 


def random_ init(n): 
return np.random.random integers(0, 1, (n, n)) 


本 例 的 完整 代码 如 下 : 

import os, pygame 

from pygame.locals import * 
import numpy as np 


from scipy import ndimage 


def get_ pixar (arr, weights): 
states = ndimage.convolve(arr, weights, mode='wrap') 


bools = (states == 13) | (states == 12 ) | (states == 3) 
return bools.astype (int) 


def draw_cross (pixar): 


(posx, posy) = pygame.mouse.get_pos() 
Dixar [DoSx; 过 ] 三 二 
pixar[:, posy] = 1 


def random init(n): 
return np.random.random integers(0, 1, (n, n)) 


def draw_ pattern (pixar, pattern): 
print pattern 


if pattern == 'glider': 
oords. = Li(O0, Ls (L272 (2.0)7 (201) {2.2 
elif pattern == 'block': 
coords = [(3,3), (3,2), (2,3), (2,2)] 
elif pattern == 'exploder': 
coords = [(0Q, Ty (L220)sy (20)> (27L)y (072 (373M 
elif pattern == 'fpentomino': 
coords: := | (2.3)., (35,2) 7 (4 2) 7 (33)(35d) 


pos = pygame.mouse.get_pos() 


xs = np.arange(0, pos[0], 10) 
ys = np.arange(0, pos[1], 10) 
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下 GO 和 Ln Re: 
£6 YY Ln Ye 
for i; J i Coords: 
pixar[x + i, y+ j] =1 


def main(): 
pygame.init () 
N = 400 
pygame.display.set_mode( (N, N)) 
pygame .display.set_ caption("Life Demo") 


screen = pygame.display.get_surface() 


pixar = random init(N) 
welignts = mp arrnay([l [L111 [L101 [lL5L1]) 


cross_on = False 


while True: 
pixar = get_pixar (pixar, weights) 


if cross_on: 
draw_cross (pixar) 


pygame.surfarray.blit array (screen, pixar * 255 xx 3) 
pygame .display.flip() 


for event in pygame.event .get() : 


if event.type == QUIT: 
return 

if event.type == MOUSEBUTTONDOWN: 
cross_on = not cross_on 

if event.type == KEYDOWN: 
if event.key == ord('r'): 


pixar = random init(N) 
print "Random init" 


if event.key == ord('g'): 
draw_pattern (pixar, 'glider') 

if event.key == ord('b') : 
draw_pattern (pixar, 'block') 

if event.key == ord('e'): 
draw_pattern(pixar, 'exploder') 

if event.key == ord('f'): 
draw_pattern (pixar, 'fpentomino') 

if name == '_main_': 





main() 


你 可 以 访问 YouTube 观 看 本 例 的 视频 ， 地 址 为 https://www.youtube.com/watch?v=NNsU- 
yWTkXM。 以 下 是 游戏 运行 时 的 截图 。 
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刚才 做 了 些 什么 





我 们 使 用 的 一 些 NumPy 和 SciPy 的 函数 需要 进一步 说 明 ， 参 见 下 面 的 表格 。 


函 数 描 述 

















ndimage . eens (arr,， weights， 该 函数 在 包 络 模式 下 对 指定 的 数组 进行 卷 积 操作 ,该 模式 会 处 理 数组 的 边界 
mode='wrap' 

PoolSrostype 该 函数 将 布尔 数组 转换 为 整数 数组 

piarange (0 Postols 20) 该 函数 创建 一 个 范围 从 0 到 pos[0] ， 且 元 素 间 隔 为 10 的 数组 。 所 以 如 果 
































pos[0] 为 1000， 我 们 将 得 到 0, 10, 20, …, 990 


11.17 ”本 章 小 结 


一 开始 ， 你 可 能 会 觉得 在 本 书 中 提 到 Pygame 有 些 奇 怪 。 和 希望 你 在 阅读 完 本 章 内 容 后 ， 觉 察 
到 一 起 使 用 NumPy 和 Pygame 的 妙 处 。 毕 竞 游戏 需要 很 多 计算 , 因此 NumPy 和 SciPy 是 理想 的 选择 。 
游戏 也 需要 人 工 智 能 ， 如 scikit-learn 中 可 以 找到 相应 的 支持 。 总 之 ,编写 游戏 是 一 件 有 趣 的 
事情 ,我 们 希望 最 后 一 章 的 内 容 如 同 前 面 十 章 教 程 的 正餐 之 后 的 甜点 或 咖啡 。 如 果 你 还 没有 “ 吃 
饱 ”， 请 参阅 本 书 作者 的 另 一 本 著作 《NumPy 攻 略 : Python 科学 计算 与 数据 分 析 》”( Packt )， 比 
本 书 更 为 深入 旦 与 本 书 内 容 互 不 重合 。 






























































@ 已 由 人 民 邮 电 出 版 社 图 灵 公司 出 版 。 一 一 编者 注 
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第 1 章 NumPy 快速 入 门 














arrange (5) 的 作用 是 什么 创建 一 个 包含 5 个 元 素 的 NumPy 数 组 ， 取 值 分 别 为 0~4 的 整数 

















第 2 章 NumpPy 基础 








ngarray 对 象 的 维度 属性 是 以 下 列 哪 种 方式 存储 的 存储 在 元 组 中 























第 3 章 常用 函数 























以 下 哪个 函数 可 以 返回 数组 元 素 的 加 权 平 均值 average 











第 4 章 便捷 函数 





以 下 哪个 函数 返回 的 是 两 个 数组 的 协 方差 cov 











第 5 章 ” 适 阵 和 通用 函数 














H 











在 使 用 mat 和 bnat 函 数 创建 矩阵 时 ， 需 要 输入 字符 串 来 定义 答 阵 。 在 字符 串 中 ， 以 下 哪 一 个 英文 | 分 号 “;” 
标点 符号 是 矩阵 的 行 分 隔 符 


























第 6 章 深入 学 习 NumPy 模块 





以 下 哪个 函数 可 以 创建 矩阵 mat 
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226 突击 测验 答案 





第 7 章 专用 函数 





以 下 哪 一 个 NumPy 模 块 可 以 生成 随机 数 





random 








第 8 章 质量 控制 

















以 下 哪 一 个 是 assert_almost_equal 函 数 的 参数 ， 





二 
| 





来 指定 小 数 点 后 的 精度 





decimal 





第 9 章 使 用 Matplotlib 绘图 








plot 函 数 的 作用 是 什么 





1、2、3 都 不 是 








第 10 章 Numpy 的 扩展 : SciPy 





以 下 哪个 函数 可 以 加 载 .mat 型 文件 


loadmat 
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NumPy 是 一 个 优秀 的 科学 计算 库 ， 提 供 了 很 多 实用 的 数学 函数 、 强 大 的 多 维 数组 对 象 和 优异 的 计算 性 能 ， 
不 仅 可 以 取代 Matlab 和 Mathematica 的 许多 功能 ， 而 且 业 已 成 为 Python 科学 计算 生态 系统 的 重要 组 成 部 分 。 但 与 
这 些 商业 产品 不 同 ， 它 是 免费 的 开源 软件 。 

本 书 从 NumPy 安 装 讲 起 ， 逐 渐 过 渡 到 数组 对 象 、 常 用 函数 、 和 矩阵 运算 、 线 性 代数 、 金 融 函 数 、 窗 函数 、 质 
量 控制 等 内 容 ， 致 力 于 向 初中 级 Python 编程 人 员 全 面 讲述 NumPy 及 其 使 用 。 另 外 ， 通 过 书 中 丰富 的 示例 ， 你 还 
将 学 会 Matplotlib 绘 图 ， 并 结合 使 用 其 他 Python 科学 计算 库 ( 如 SciPy 和 Scikits ) ， 让 工作 更 有 成 效 ， 让 代码 更 加 
简洁 而 高 效 。 


在 不 同 平台 安装 NumPy; 

用 简洁 高 效 的 NumPy 代 码 实现 高 性 能 计算 ; 
使 用 功能 强大 的 通用 函数 ; 

使 用 NumPy 数 组 和 矩阵 ; 

用 NumpPy 模 块 轻松 执行 复杂 的 数值 计算 ; 
Matplotlib 绘 图 ; 

NumPy 代 码 测试 。 





ISBN 978-7-115-33940-9 
如 社区: Tu | | | 
9 “7 871415 39409 > 


ISBN 978-7-115-33940-9 
定价 : 49.00 元 





计算 机 /程序 设计 /Python 





欢迎 加 入 
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最 前 沿 的 T 类 电子 书 发 售 平台 

























































































































































































































































































































































































































































































































































































































































































































































































































































































































































































E 子 出 版 的 时 代 已 经 来 临 。 在 许多 出 版 界 同 行 还 在 狂 图 灵 社 区 进一步 把 传统 出 版 流程 与 电子 书 出 版 业务 
玉 入 特 的 时 候 ， 图 灵 社 区 已 经 采取 实际 行动 拥抱 这 个 。 紧密 结合 ， 目 前 已 实现 作 译 者 网 上 交 稿 、 编 辑 网 上 
出 版 业 巨 变 。 作 为 国内 第 一 家 发 售 电子 图 书 的 IT 类 出 7? 稿 、 按 章 发 布 的 电子 出 版 模式 。 这 种 新 的 出 版 模 
版 商 ， 图 灵 社 区 目前 为 读者 提供 两 种 DRM-free 的 阅读 式 ， 我 们 称 之 为 “敏捷 出 版 ”， 它 可 以 让 读者 以 较 
体验 ， 在线 阅读 和 PDF。 快 的 速度 了 解 到 国外 最 新 技术 图 书 的 内 容 ， 弥 补 以 
往 翻译 版 技术 书 “ 出 版 即 过 时 ”的 缺 佑 。 同 时 ， 敏 

相 比 经 质 书 ， 电 子 书 具有 许多 明显 的 优势 。 它 不 仅 发 。 。。 捷 出 版 使 得 作 、 译 、 编 、 读 的 交流 更 为 方便 ， 可 以 
’ 快 ， 更 新 窑 魏 ， 而 且 尽 可 能 采用 了 彩色 图 片 即使。 如 前 消灭 书稿 中 的 错误 ， 最 大 程度 地 保证 图 书 出 版 
有 的 书 纸 质 版 是 黑白 印刷 的 ) 。 读 者 还 可 以 方便 地 进 ig 

行 搜索 、 剪 贴 、 复 制 和 打印 。 

最 方便 的 开放 出 版 平台 最 直接 的 读者 交流 平台 

图 灵 社 区 向 读者 开放 在 线 写作 功能 ， 协 助 你 实现 自 出 在 图 灵 社 区 ， 你 可 以 十 分 方便 地 写作 文章 、 提 交 昌 
版 和 开源 出 版 的 梦想 。 利 用 “合集 ”功能 ， 你 就 能 联 误 、 发 表 评论 ， 以 各 种 方式 与 作 译 者 、 编 辑 人 员 和 
合 二 三 好 友 共 同 创作 一 部 技术 参考 书 ， 以 免费 或 收费 其 他 读者 进行 交流 互动 。 提 交 勘 误 还 能 够 获 赠 社区 
的 形式 提供 给 读者 。 (收费 形式 须 经 过 图 灵 社 区 立项 银子 。 
评审 。) 这 极 大 地 降低 了 出 版 的 门槛 。 只 要 你 有 写作 

的 意愿 ， 图 灵 社 区 就 能 帮助 你 实现 这 个 梦想 。 成 熟 的 你 可 以 积极 参 写 社区 经 常 开展 的 访谈 、 和 审读 、 评 先 
书稿 ， 有 机 会 入 选 出 版 计划 ， 同 时 出 版 纸 质 书 。 等 多 种 活动 ， 启 取 积 分 和 银子 ， 积 累 个 人 声望 。 
图 灵 社 区 引进 出 版 的 外 文 图 书 ， 都 将 在 立项 后 马上 在 
社区 公布 。 如 果 你 有 意 翻 译 哪 本 图 书 ， 欢 迎 你 来 社区 

请 。 只 要 你 通过 试 译 的 考验 ， 即 可 签约 成 为 图 灵 的 





















































译 者 。 当 然 ， 要 想 成 功 地 完成 一 本 书 的 翻译 工作 ， 是 
需要 有 坚强 的 角力 的 。 
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